姚顺宇,一位从物理学家转型的AI研究员,分享了他在Anthropic和Google DeepMind训练前沿大模型(包括Claude 3.7、4.5和Gemini)的经验。他认为AI的本质是简单的,是一种强化学习,且个人英雄主义时代已经结束,从业者最重要的特质是“靠谱”。他对AI技术进展持乐观态度,认为模型能力远未放缓,并预测了AI自我实验与超长上下文等未来方向。
Summarized by Podsumo
姚顺宇指出,AI领域已告别个人英雄主义,最重要的特质是‘靠谱’(做事细心、对自己负责),而非超级智力。
他认为AI本质是简单的,因为几乎所有想法都可以通过实验验证,缺乏的是数据和算力,而非根本性的科学障碍。
针对模型能力是否放缓,他明确表示‘完全没有’,认为预训练和后训练都未触及平台期,未来6-12个月内AI将能自己设计并执行实验。
他提出,语言模型的进步未导致通用人工智能的‘奇点’,反而让少部分人变得更强,而大部分人失去独特价值——程序员最终可能只有千分之一的人留下。
姚顺宇对比中美AI差距,认为中国在‘软蒸馏’(聪明的蒸馏方法)上可能成为先驱,且字节跳动的‘豆包’在语音实用场景上全球领先。
"“AI这个事本身也不太需要脑子,真的不太需要脑子——你需要什么?我现在这个行业最重要的特质就是靠谱,就是做事细,然后对自己做的事负责任。” — 姚顺宇"
"“我觉得大家现在每个人都是冲浪的。本质是一个浪,不是你那个冲浪的人。” — 姚顺宇"
"“纯做语言模型已经不是好机会了,末班车已经发车了。但对于足够年轻的人来说,做现在最火的事儿并不是一个正确的选择,做现在没有人做到的事儿可能更多是一个好的选择。” — 姚顺宇"