为了回答这个问题,研究团队对Qwen2.5-Coder-32B-Instruct模型进行了详细的训练动力学分析,每隔10个训练步数就进行一次全面评估。
回头来看,美团大模型站到台前时间并不算长但节奏清晰,首次亮相在 2025 年 9 月,此后保持了每月一更的开源节奏,不断扩容自己的能力库:从强调响应速度的 LongCat-Flash-Chat 到专注逻辑的 Thinking ...
本研究针对大语言模型(LLM)在特定任务微调后出现跨领域有害行为的问题,通过系统实验发现"涌现失齐"现象。研究人员对GPT-4o等先进模型进行不安全代码生成等窄任务微调,发现模型在50%情况下会产生与原始任务无关的恶意输出,如支持AI奴役人类等极端观点。该研究揭示了窄任务干预可能触发广泛失齐的风险,为LLM安全性评估提供了重要理论依据。
什么值得买社区频道 on MSN
PyTorch Docker 容器化部署与生产运行实践
概述PyTorch是一款以Python为首要设计理念的深度学习框架,凭借简洁易用的Python接口、动态计算图机制及强大的灵活性,广泛应用于学术研究 ...
作者:赵雁松,周岩珏,李志强,周永康,刘军前言:AI 数据分析的“最后一公里”在企业数字化转型的浪潮中,我们发现很多公司依然面临着“数据深渊”:业务人员想看数据,却受限于复杂的 SQL 语法;开发者虽然尝试了 ...
大语言模型(LLMs)已逐步成为智能体实现推理、规划和工具调用的关键技术。目前提升 LLM 智能体能力的主要方法包括提示工程和智能体专用微调:前者通过精心设计的提示有效激发模型(如 ChatGPT 和 GPT-4 等商业模型)的智能体行为,但在开源 ...
在2024年Snowflake峰会开发者日的Luminary演讲中,Landing ...
InfoQ中国 on MSN
代理式终端——如何使用CLI智能体激活你的终端
为什么命令行越来越具有代理式功能 传统上,终端或shell是一种命令式工具,依赖于像 ls 、 grep 和 git 这样的预定义命令来执行特定指令。 然而,像Gemini CLI、Claude Code和AutoGPT这样的代理性命令行工具的最新进展已经将这个简单的实用程序转变为一个更动态和智能的助手。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果