原始采访:Bilibili 视频采访:OpenAI 研究员翁家翌本文记录了从该访谈中提炼出的对个人成长、工程实践及 OpenAI 工作模式的思考与洞见。
翁家翌学习笔记总结图1. 重新定义评价体系:跳出“标准游戏”,自己制定规则
- 看透GPA的虚荣: 本科时就要意识到,GPA是一个3年后毫无价值的指标。如果你的目标是长远的(比如找工作或做成某件事),那只要维持GPA在“及格/够用”的底线即可,多花一分精力都是浪费。
- 不要用学校的规则(考试分数)卷自己,要用行业的规则卷自己。
- 翁家翌给自己定的KPI非常明确:论文 + 比赛 + GitHub千星项目。这才是让他在大厂和顶尖实验室脱颖而出的资本。
- 做事的标准不是“这题我做对了没有”,而是“这事儿有多少人在用,有多少人因为我受益”。
- 不论是开源清华作业,还是写“天授”RL框架,亦或是“退学网”,他的每一次出圈,都是因为解决了别人的真实痛点,从而积累了巨大的Credit。
不要当那种在那自嗨“我学了多少知识”的人,要当“我做出了什么别人能用的东西”的人。
2. 工业界 vs 学术界:工程能力才是AI时代的“核武器”
- 打破PhD迷信: 如果目标是进工业界(尤其是现在的AI Lab),读PhD可能是在浪费生命。
- 现在的科研不再是小作坊式的算法创新,而是拼大规模基础设施(Infra)。
- 现在的瓶颈不在Idea,Idea is cheap,随便找个大牛聊聊就有。
- “教一个Researcher做好Engineering,远比教一个Engineer做好Research要难。”
- 在AI时代,谁能搭建出稳定、高效的训练框架,谁就是不可替代的。翁家翌之所以能把名字挂在所有OpenAI的模型上,是因为他是那个修路、造铲子的人(RL Infra负责人)。
- 学术界还在这调参、那调参,在一个Toy Task(玩具任务)上卷分数。
- 工业界只看单位时间内能迭代多少次。谁的Infra稳,谁修的Bug多,谁就能跑得快。
做项目,别光盯着算法本身,多看看Data Pipeline、分布式训练、工程化部署。做一个能把System跑通的人,比做一个只会推公式的人更有价值。
3. OpenAI的内部洞察:祛魅“黑魔法”
- 外界以为ChatGPT是惊天动地的算法突破,内部视角看,其实是一堆工程优化的结果。
- Llama之所以训不过GPT,很可能不是模型架构差多少,而是他们的Infra Bug太多,导致训练效率低、效果差。
- 在大模型里搞RL,难点不在于RL算法本身(甚至没啥新东西),难点在于Scale up(扩展)。
- 如何在几千张卡上,让这个巨大的模型不崩、高效地采样和训练,这全是脏活累活(Dirty Work)。
- OpenAI之所以强,是因为信息无损流通。Sam Altman和Greg Brockman这种级别的人,依然保持对技术细节的极度敏感。
- 一旦组织变大,必然出现“信息茧房”和代码腐化。解决办法只有一个:保持高人才密度,小团队作战,容忍不了平庸。
所谓壁垒,往往就是别人不愿意干的脏活累活(修Bug、洗数据、搭基建)堆出来的。没有什么魔法,全是基本功。
4. 如何向翁家翌学习?(Actionable Advice)
- 不管是出于兴趣还是功利,去写开源项目。不是为了炫技,而是为了好用。
- 他在写“天授”时,是因为受不了现有框架太难用。你要做那个解决“难用”的人。
- 极致的独立开发能力(Solo Capability):
- 在这个AI辅助编程的时代,一个人的战斗力被无限放大。
- 翁家翌强调Consistency(一致性)。很多时候,一个人把顶层设计想清楚,快速写出来的第一版代码,比十个人开会讨论出来的“屎山”要强一百倍。具备独立完成从Idea到Demo全流程的能力。
- 不要只看当下什么火(比如现在的Prompt工程),要看什么技能是5年后依然稀缺的。
- 他在初中就自学微积分,不是为了考试,是为了以后学物理快。
- 他在大二就意识到RL Infra重要,而不是去卷CV(计算机视觉)。
最后
我们要学的不是他的智商(这学不来),而是他的判断力。 判断什么对未来重要,判断什么才是真正的贡献,然后利用强大的工程落地能力,把这个判断变成现实。