前些天,CMU 助理教授、TVM/XGBoost/MLC-LLM 的创造者陈天奇发布了一本免费在线书籍《 Modern GPU Pr ogram ming For MLSys(面向机器学习系统的现代 GPU 编程) 》。
在人工智能的蛮荒时代,我们习惯于将大模型视为一个黑箱。我们往里面投入语料、算力和电力,然后期待它吐出智能。然而,随着OpenAI从非营利实验室蜕变为估值数万亿美元的科技巨兽,其内部运转的逻辑早已超越了简单的“训练-推理”模型。如今,驱动这个庞然大物的,是一种更为隐秘、更为暴烈的力量——Token的重新分配。 Token,这个在自然语言处理中微不足道的计量单位,此刻正扮演着“数字石油”的角色。谁掌握 ...
谁是AI Agent竞赛中真正的胜负手?1781次真实运行给出的答案不是模型。 AI评估平台Braintrust从Hugging ...
吃豆人又卡进了墙里。 电脑前的彭同学,与这款他投入大量热情制作的小游戏,也同步经历着一次“碰壁” 这种Bug在游戏开发中并不少见,即便是流行了40余年的经典玩法,想兼顾在迷宫中移动、与“敌人”追逐等功能,就得考量转向逻辑、移动帧位等问题,要花不少心思 ...
获得银奖的作品名为《精子的罗曼蒂克消亡史》,创作者是一位执业多年的泌尿外科医生。铜奖《精益创业咨询所》,则出自一位深耕 AI 咨询行业的产品经理之手。从整张获奖名单来看," 抹平技术门槛 " ...
对Anthropic贴脸开大:智谱GLM-5.2凭什么杀入世界编程三强?
作者|林易 编辑|重点君 就在刚刚,豆包专业版正式上线了。 一个比较直观的变化,就是现在的豆包里多了个办公任务模式: 从界面看,输入框旁边新增了“本地电脑”入口,也有Skills技能菜单。用户可以让它连接本地电脑,也可以根据任务选择不同技能,比如代码、市场研究、视频处理、记忆管理等。 这个形态有点像面向普通用户的Harness。
研究团队提出了一种无训练、即插即用的解码策略——Confident Decoding(置信解码)。 传统认知默认:随着网络深度单调递增,思考结果也会变得更准确。 各类开源自回归大语言模型(LLM)的生成,也总是从最后一层输出。 然而,来自Qwen团队、清华大学、南洋 ...