"Attention Is All You Need"作者Noam Shazeer离开Google加入OpenAI
Transformer论文合著者、Gemini联合负责人Noam Shazeer宣布离开Google加入OpenAI。从Character.AI到$27亿重返Google,再到跳槽OpenAI——这场AI人才争夺战背后的深层逻辑。
“Attention Is All You Need”作者Noam Shazeer离开Google加入OpenAI
当Transformer架构的合著者、Google Gemini的联合负责人宣布加入OpenAI时,整个AI行业都意识到:这场人才战争的烈度,已经超出了所有人的预期。
引言:一篇论文,一场革命,一次跳槽
2026年6月18日,Noam Shazeer在X(原Twitter)上发布了一条简短的声明:他将离开Google,加入OpenAI。
这条消息之所以引发地震般的反响,是因为Shazeer的身份实在太特殊了——他是2017年那篇改变世界的论文《Attention Is All You Need》的八位合著者之一。这篇论文提出的Transformer架构,成为了GPT、Claude、Gemini等所有现代大语言模型的基石。没有Transformer,就没有今天的生成式AI浪潮。
而Shazeer的这次跳槽,距离他重返Google仅仅过去了不到两年。2024年8月,Google以约27亿美元的天价将Shazeer和他的创业公司Character.AI重新收入麾下。如今,这位”Google最昂贵的员工”选择了再次离开——而且目的地是Google在AI领域最强劲的竞争对手。
一、Shazeer的职业轨迹:从Google spell checker到Transformer之父
1.1 Google的”老臣”(2000-2021)
Noam Shazeer的职业生涯几乎与Google同龄。2000年,他加入Google,比公司IPO还早了四年。在Google的早期岁月里,Shazeer参与了多个关键项目,其中最广为人知的是Google的拼写检查器(spell checker)——那个在你输错单词时贴心地提示”你是不是想搜…”的功能。
但Shazeer真正的贡献在更深层。他在Google的二十多年里,始终处于机器学习研究的最前沿。从早期的神经网络实验到后来的深度学习突破,Shazeer是Google Brain团队的核心成员之一。他与Ashish Vaswani、Niki Parmar等人合作,在2017年发表了那篇注定载入史册的论文。
《Attention Is All You Need》的核心理念是用”自注意力机制”(Self-Attention)替代传统的RNN和CNN架构。这一创新不仅大幅提升了序列建模的效率,更重要的是,它让模型能够并行处理整个序列,为后来训练数十亿参数的大模型奠定了架构基础。
1.2 出走创业:Character.AI的诞生(2021-2024)
2021年,在Google工作了21年后,Shazeer选择了离开。与他一同离开的还有Daniel De Freitas,两人共同创立了Character.AI。
Character.AI的理念很简单但极具前瞻性:让用户能够与AI角色进行开放式对话。用户可以创建自己的AI角色,赋予它们特定的性格、背景和知识领域。这个概念在2022年底ChatGPT爆火之前就已经存在,但Character.AI凭借其出色的对话质量和角色扮演的深度,迅速积累了大量用户。
到2024年,Character.AI已经成长为一家估值数十亿美元的独角兽公司,月活跃用户超过数千万。Shazeer作为CEO和首席科学家,将他在Transformer架构上的深厚积累转化为了一款现象级消费产品。
1.3 天价回归:$27亿重返Google(2024-2026)
2024年8月,Google做了一笔让整个硅谷侧目的交易:以约27亿美元的价格,将Shazeer和Character.AI的核心团队重新带回Google。
这笔交易的结构颇为复杂。Google并非直接收购Character.AI公司,而是通过授权协议和人才雇佣的方式,将Shazeer、De Freitas以及部分关键研究人员重新纳入麾下。Character.AI公司继续独立运营,但失去了最核心的技术团队。
Shazeer回到Google后,被任命为Gemini的联合负责人(Co-Lead),同时担任VP of Engineering。这个位置让他直接参与Google最核心的大模型战略,负责Gemini系列模型的技术路线和工程落地。
当时,业界普遍认为这笔交易是Google的”防守性收购”——防止Shazeer这样的顶级人才流向竞争对手。27亿美元买一个”人”,这在科技史上也是罕见的。
1.4 再次出走:加入OpenAI(2026年6月)
然而,仅仅22个月后,Shazeer再次选择了离开。
2026年6月18日,Shazeer在X上发布声明,宣布加入OpenAI。他没有透露具体的职位,但据The Decoder和9to5Google等科技媒体报道,Shazeer将在OpenAI担任VP of Engineering级别的职位,直接向CTO汇报。
这次跳槽的震撼程度,不亚于当年Geoffrey Hinton离开Google。区别在于,Hinton的离开更多是出于对AI安全的担忧,而Shazeer的离开则明显带有”择木而栖”的色彩——他选择了他认为更有前景的平台。
二、对Google Gemini的沉重打击
2.1 技术领导力的真空
Shazeer的离开对Google Gemini团队来说是一个巨大的打击。作为联合负责人,Shazeer不仅负责技术路线,还直接参与核心架构的设计和优化。他的离开意味着Gemini团队在Transformer架构最权威的专家之一突然流失。
更微妙的是时间点的敏感性。2026年上半年,Gemini 3.5系列刚刚发布,在与GPT-5.5和Claude Opus 4.7的竞争中表现尚可,但并未形成明显优势。Shazeer的离开发生在Gemini需要技术突破的关键时刻,这无疑会给团队士气带来负面影响。
2.2 $27亿投资的”沉没成本”
Google为Shazeer的回归支付了约27亿美元,这笔交易在22个月后就变成了”沉没成本”。从投资回报率的角度来看,这是Google近年来最昂贵的人才失误之一。
但更深层的损失在于信号效应。当一位Google花天价请回来的技术领袖选择再次离开,这向外界传递了一个强烈的信号:即使是Google,也无法留住最顶尖的AI人才。这种信号对Google的招聘和品牌都会造成长期影响。
2.3 Gemini的技术路线不确定性
Shazeer在Gemini期间,一直推动多模态架构的深度融合——这是他区别于其他Transformer研究者的独特视角。他的离开可能会让Gemini在多模态融合方面的技术路线出现摇摆。
据9to5Google报道,Google内部已经在紧急讨论Gemini的技术领导层重组方案。Sundar Pichai亲自介入,要求HR团队在两周内提出继任者名单。但找到一个在Transformer架构上有同等造诣、同时又有产品化经验的领导者,谈何容易。
三、对OpenAI的战略意义
3.1 架构层面的”核武器”
Shazeer加入OpenAI,最直接的收益是架构层面的深度优化。作为Transformer的合著者,Shazeer对注意力机制的理解是教科书级别的。他可能会推动OpenAI在下一代模型架构上进行突破性创新。
业界猜测,Shazeer可能会主导以下几个方向:
- 更高效的注意力机制:当前Transformer的二次复杂度(quadratic complexity)是扩展上下文窗口的主要瓶颈。Shazeer可能会推动线性注意力或稀疏注意力的研究。
- 多模态统一架构:Shazeer在Character.AI期间积累了丰富的对话式AI产品经验,这可能会加速OpenAI在多模态模型上的进展。
- 推理效率优化:随着模型规模的增长,推理成本成为关键瓶颈。Shazeer在Google期间参与过多个推理优化项目,这些经验对OpenAI的API业务至关重要。
3.2 IPO前的”人才信号”
OpenAI正在积极筹备IPO,预计估值将超过8500亿美元。在这个关键节点上,引入Shazeer这样一位级别的技术领袖,具有强烈的信号意义。
对投资者而言,Shazeer的加入意味着OpenAI在技术上仍然具有最强的吸引力。如果连Transformer之父都选择OpenAI而非Google,那么OpenAI的技术领先地位就得到了最有力的背书。
The Decoder的分析指出,Shazeer的加入可能会让OpenAI的IPO估值再增加5-10%。在一个由叙事驱动的市场中,这种”顶级人才投票”的影响力不容小觑。
3.3 与Karpathy形成”双雄”格局
值得注意的是,2026年AI人才战争的另一大事件是Andrej Karpathy加入Anthropic。Karpathy是OpenAI的创始成员之一,也是Tesla前AI总监,他的加入让Anthropic的技术实力大幅提升。
现在,OpenAI有了Shazeer作为回应。这两位都是Transformer生态系统中最重要的技术领袖之一——Karpathy代表了工程化和产品化的极致,Shazeer代表了架构创新的源头。两人在OpenAI和Anthropic的”隔空对决”,将成为未来两年AI技术竞争的最大看点。
四、AI人才战争进入白热化
4.1 2026年的”人才地震”
2026年已经成为AI人才流动最剧烈的一年。除了Shazeer和Karpathy的两大地震级跳槽,还有多起重要的人才流动:
- Dario Amodei(Anthropic CEO):持续从OpenAI和Google挖角核心研究人员
- Demis Hassabis(Google DeepMind CEO):推动Google内部的人才整合,但面临留不住人的困境
- 中国AI公司:DeepSeek、月之暗面等公司以极具竞争力的薪酬吸引海外华人AI人才回流
4.2 为什么顶级人才不再”忠诚”?
Shazeer的两次离开Google,揭示了一个深层趋势:在AI领域,顶级研究人员对单一雇主的忠诚度正在快速下降。
原因有几个:
- 技术迭代速度太快:一年前的技术路线可能今天就过时了,研究人员希望跟随最有前景的方向
- 创业文化的浸润:Shazeer自己就是创业者,他更习惯于根据机会而非组织忠诚度做决策
- 薪酬差距缩小:OpenAI、Anthropic等公司的薪酬已经可以与Google匹敌,甚至更高
- 使命驱动的吸引力:OpenAI的AGI使命对很多研究人员具有独特的吸引力
4.3 对行业的长期影响
人才战争的加剧,正在重塑AI行业的竞争格局:
- 大公司的”防守性收购”增加:Google对Character.AI的27亿美元交易可能只是一个开始
- 人才流动性成为核心竞争力:能够快速吸引和整合顶级人才的公司,将在技术竞争中占据优势
- 学术与产业的边界模糊:像Shazeer这样的研究者,同时具有顶尖的学术背景和产品化经验,成为最稀缺的人才类型
五、开发者视角:API消费者该如何应对?
5.1 模型竞争加剧 = 更好的产品
对于使用NixAPI等聚合平台的开发者来说,Shazeer的跳槽是一个利好消息。顶级人才的流动会加速技术竞争,最终受益的是API消费者。
OpenAI有了Shazeer,可能会在以下方面加速迭代:
- 更长的上下文窗口(Shazeer在长序列建模方面有深厚积累)
- 更高效的多模态处理
- 更低的推理延迟
Google失去Shazeer后,可能会加大在Gemini上的投入以证明”没有Shazeer也能行”,这同样会推动技术进步。
5.2 不要押注单一供应商
Shazeer的跳槽再次证明了一个原则:在AI领域,技术领导力的分布是高度动态变化的。今天的领先者可能明天就失去关键人才,今天的追赶者可能明天就实现突破。
对于依赖API的开发者,建议:
- 保持多供应商架构,避免对单一模型的深度依赖
- 关注NixAPI等聚合平台,灵活切换不同模型
- 将模型视为可替换的组件,而非核心资产
5.3 关注架构创新的信号
Shazeer的加入可能会带来OpenAI在架构层面的重大创新。开发者应该密切关注:
- 新的注意力机制变体
- 多模态统一架构的进展
- 推理效率的突破性提升
这些创新一旦落地,可能会改变当前的成本-性能平衡,为开发者创造新的机会。
六、总结:人才市场正在定义AI的下一个阶段
Noam Shazeer从Google到OpenAI的跳槽,不仅仅是一个人的职业选择。它是AI行业进入”人才定义竞争”阶段的标志性事件。
在这个新阶段,技术壁垒的半衰期越来越短,人才成为最稀缺的竞争要素。Google花了27亿美元试图锁定Shazeer,但失败了。OpenAI用使命和前景吸引了Shazeer,但代价是稀释股权和面临更严格的监管。
对于NixAPI的开发者用户,这场人才战争意味着:
- 更快的技术进步:顶级人才的竞争会加速模型迭代
- 更多的模型选择:不同公司会发展出差异化的技术优势
- 更低的长期成本:竞争最终会传导到定价端
最后,值得记住的是:Transformer架构是八位作者共同创造的。Shazeer的离开不会改变Google在这个架构上的深厚积累,但他的加入会让OpenAI在下一个架构创新中占据先机。
AI的竞争,从来不仅仅是算力和数据的竞争。归根结底,是人的竞争。而2026年6月18日,Noam Shazeer用他的选择,为这场竞争写下了新的一章。
参考资料: