Claude 3推出了200K上下文,GPT-4 Turbo跟进128K,Gemini 1.5 Pro更是号称支持100万token。
后来出现了所谓的Agentic编程——Claude Code、Cursor Agent、Windsurf等工具让AI可以自主执行多步任务,读取文件、运行命令、修复错误。 直到GPT-5.2。 Cursor团队让GPT-5.2持续运行了 整整一周 ...
当大多数AI编程工具还在满足于“一问一答”的短对话模式时,Cursor团队完成了一项令人震惊的实验:他们让GPT-5.2模型持续运行168小时,不间断地编写代码,最终成功构建了一个功能完整的浏览器渲染引擎。这一壮举不仅打破了人们对AI“短时记忆”的固有认知,更揭示了人工智能在复杂工程任务中的巨大潜力。