大家好,我是袋鼠帝。 就在昨天,Kimi 带来了他们 2026 年以来的第一个重磅发布。 看到一众大佬都纷纷发布了他们的实测,我也坐不住了,又是连夜开整。 不过我是真滴想说,AI圈真的别再卷啦。。都快过年了,不知道今年能不能过个好年呀...
有时候,模型还会顺手改掉或删掉一些它们不喜欢或不理解的注释和代码,即使这些跟当前任务毫无关系。而且这些问题在 CLAUDE.md 里写了明确的指令要求也解决不了。 具体做法包括:让它先写测试,再通过测试;把它和浏览器 MCP 放在同一个循环里;先写一个很可能正确但很朴素的算法,再让它在保持正确性的前提下优化;把你的方法从命令式 转为声明式,可以让 Agent 循环得更久、杠杆更大。 Claude ...
Anthropic先是禁止自家订阅服务用于Clawdbot的API积分,又强制其更名,避免和Claude关联,这波操作堪称白扔到手的福利。Kimi K2.5发布了,开源,而且据说无论如何都比Opus ...
CooperBench的研究结果说明我们不能简单地认为,只要把模型做得更聪明(参数更大、代码生成能力更强),它就会自动成为好队友。GPT-5的单打独斗能力很强,但在协作中依然表现拙劣。这说明社会智能(Social ...
科技行者 on MSN
AI代理技能生态安全大调查:超过四分之一的技能包存在安全漏洞
这项由南洋理工大学、天津大学、南十字大学、新南威尔士大学等多所知名高校联合开展的研究发表于2026年的国际计算机安全会议(Conference'17),感兴趣的读者可以通过论文编号arXiv:2601.10338v1查询完整内容。 近年来,AI代理(AI ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果