Transformer论文合著者、Gemini联合负责人Noam Shazeer宣布离开Google加入OpenAI。从Character.AI到$27亿重返Google，再到跳槽OpenAI——这场AI人才争夺战背后的深层逻辑。

“Attention Is All You Need”作者Noam Shazeer离开Google加入OpenAI

当Transformer架构的合著者、Google Gemini的联合负责人宣布加入OpenAI时，整个AI行业都意识到：这场人才战争的烈度，已经超出了所有人的预期。

引言：一篇论文，一场革命，一次跳槽

2026年6月18日，Noam Shazeer在X（原Twitter）上发布了一条简短的声明：他将离开Google，加入OpenAI。

这条消息之所以引发地震般的反响，是因为Shazeer的身份实在太特殊了——他是2017年那篇改变世界的论文《Attention Is All You Need》的八位合著者之一。这篇论文提出的Transformer架构，成为了GPT、Claude、Gemini等所有现代大语言模型的基石。没有Transformer，就没有今天的生成式AI浪潮。

而Shazeer的这次跳槽，距离他重返Google仅仅过去了不到两年。2024年8月，Google以约27亿美元的天价将Shazeer和他的创业公司Character.AI重新收入麾下。如今，这位”Google最昂贵的员工”选择了再次离开——而且目的地是Google在AI领域最强劲的竞争对手。

一、Shazeer的职业轨迹：从Google spell checker到Transformer之父

1.1 Google的”老臣”（2000-2021）

Noam Shazeer的职业生涯几乎与Google同龄。2000年，他加入Google，比公司IPO还早了四年。在Google的早期岁月里，Shazeer参与了多个关键项目，其中最广为人知的是Google的拼写检查器（spell checker）——那个在你输错单词时贴心地提示”你是不是想搜…”的功能。

但Shazeer真正的贡献在更深层。他在Google的二十多年里，始终处于机器学习研究的最前沿。从早期的神经网络实验到后来的深度学习突破，Shazeer是Google Brain团队的核心成员之一。他与Ashish Vaswani、Niki Parmar等人合作，在2017年发表了那篇注定载入史册的论文。

《Attention Is All You Need》的核心理念是用”自注意力机制”（Self-Attention）替代传统的RNN和CNN架构。这一创新不仅大幅提升了序列建模的效率，更重要的是，它让模型能够并行处理整个序列，为后来训练数十亿参数的大模型奠定了架构基础。

1.2 出走创业：Character.AI的诞生（2021-2024）

2021年，在Google工作了21年后，Shazeer选择了离开。与他一同离开的还有Daniel De Freitas，两人共同创立了Character.AI。

Character.AI的理念很简单但极具前瞻性：让用户能够与AI角色进行开放式对话。用户可以创建自己的AI角色，赋予它们特定的性格、背景和知识领域。这个概念在2022年底ChatGPT爆火之前就已经存在，但Character.AI凭借其出色的对话质量和角色扮演的深度，迅速积累了大量用户。

到2024年，Character.AI已经成长为一家估值数十亿美元的独角兽公司，月活跃用户超过数千万。Shazeer作为CEO和首席科学家，将他在Transformer架构上的深厚积累转化为了一款现象级消费产品。

1.3 天价回归：$27亿重返Google（2024-2026）

2024年8月，Google做了一笔让整个硅谷侧目的交易：以约27亿美元的价格，将Shazeer和Character.AI的核心团队重新带回Google。

这笔交易的结构颇为复杂。Google并非直接收购Character.AI公司，而是通过授权协议和人才雇佣的方式，将Shazeer、De Freitas以及部分关键研究人员重新纳入麾下。Character.AI公司继续独立运营，但失去了最核心的技术团队。

Shazeer回到Google后，被任命为Gemini的联合负责人（Co-Lead），同时担任VP of Engineering。这个位置让他直接参与Google最核心的大模型战略，负责Gemini系列模型的技术路线和工程落地。

当时，业界普遍认为这笔交易是Google的”防守性收购”——防止Shazeer这样的顶级人才流向竞争对手。27亿美元买一个”人”，这在科技史上也是罕见的。

1.4 再次出走：加入OpenAI（2026年6月）

然而，仅仅22个月后，Shazeer再次选择了离开。

2026年6月18日，Shazeer在X上发布声明，宣布加入OpenAI。他没有透露具体的职位，但据The Decoder和9to5Google等科技媒体报道，Shazeer将在OpenAI担任VP of Engineering级别的职位，直接向CTO汇报。

这次跳槽的震撼程度，不亚于当年Geoffrey Hinton离开Google。区别在于，Hinton的离开更多是出于对AI安全的担忧，而Shazeer的离开则明显带有”择木而栖”的色彩——他选择了他认为更有前景的平台。

二、对Google Gemini的沉重打击

2.1 技术领导力的真空

Shazeer的离开对Google Gemini团队来说是一个巨大的打击。作为联合负责人，Shazeer不仅负责技术路线，还直接参与核心架构的设计和优化。他的离开意味着Gemini团队在Transformer架构最权威的专家之一突然流失。

更微妙的是时间点的敏感性。2026年上半年，Gemini 3.5系列刚刚发布，在与GPT-5.5和Claude Opus 4.7的竞争中表现尚可，但并未形成明显优势。Shazeer的离开发生在Gemini需要技术突破的关键时刻，这无疑会给团队士气带来负面影响。

2.2 $27亿投资的”沉没成本”

Google为Shazeer的回归支付了约27亿美元，这笔交易在22个月后就变成了”沉没成本”。从投资回报率的角度来看，这是Google近年来最昂贵的人才失误之一。

但更深层的损失在于信号效应。当一位Google花天价请回来的技术领袖选择再次离开，这向外界传递了一个强烈的信号：即使是Google，也无法留住最顶尖的AI人才。这种信号对Google的招聘和品牌都会造成长期影响。

2.3 Gemini的技术路线不确定性

Shazeer在Gemini期间，一直推动多模态架构的深度融合——这是他区别于其他Transformer研究者的独特视角。他的离开可能会让Gemini在多模态融合方面的技术路线出现摇摆。

据9to5Google报道，Google内部已经在紧急讨论Gemini的技术领导层重组方案。Sundar Pichai亲自介入，要求HR团队在两周内提出继任者名单。但找到一个在Transformer架构上有同等造诣、同时又有产品化经验的领导者，谈何容易。

三、对OpenAI的战略意义

3.1 架构层面的”核武器”

Shazeer加入OpenAI，最直接的收益是架构层面的深度优化。作为Transformer的合著者，Shazeer对注意力机制的理解是教科书级别的。他可能会推动OpenAI在下一代模型架构上进行突破性创新。

业界猜测，Shazeer可能会主导以下几个方向：

更高效的注意力机制：当前Transformer的二次复杂度（quadratic complexity）是扩展上下文窗口的主要瓶颈。Shazeer可能会推动线性注意力或稀疏注意力的研究。
多模态统一架构：Shazeer在Character.AI期间积累了丰富的对话式AI产品经验，这可能会加速OpenAI在多模态模型上的进展。
推理效率优化：随着模型规模的增长，推理成本成为关键瓶颈。Shazeer在Google期间参与过多个推理优化项目，这些经验对OpenAI的API业务至关重要。

3.2 IPO前的”人才信号”

OpenAI正在积极筹备IPO，预计估值将超过8500亿美元。在这个关键节点上，引入Shazeer这样一位级别的技术领袖，具有强烈的信号意义。

对投资者而言，Shazeer的加入意味着OpenAI在技术上仍然具有最强的吸引力。如果连Transformer之父都选择OpenAI而非Google，那么OpenAI的技术领先地位就得到了最有力的背书。

The Decoder的分析指出，Shazeer的加入可能会让OpenAI的IPO估值再增加5-10%。在一个由叙事驱动的市场中，这种”顶级人才投票”的影响力不容小觑。

3.3 与Karpathy形成”双雄”格局

值得注意的是，2026年AI人才战争的另一大事件是Andrej Karpathy加入Anthropic。Karpathy是OpenAI的创始成员之一，也是Tesla前AI总监，他的加入让Anthropic的技术实力大幅提升。

现在，OpenAI有了Shazeer作为回应。这两位都是Transformer生态系统中最重要的技术领袖之一——Karpathy代表了工程化和产品化的极致，Shazeer代表了架构创新的源头。两人在OpenAI和Anthropic的”隔空对决”，将成为未来两年AI技术竞争的最大看点。

四、AI人才战争进入白热化

4.1 2026年的”人才地震”

2026年已经成为AI人才流动最剧烈的一年。除了Shazeer和Karpathy的两大地震级跳槽，还有多起重要的人才流动：

Dario Amodei（Anthropic CEO）：持续从OpenAI和Google挖角核心研究人员
Demis Hassabis（Google DeepMind CEO）：推动Google内部的人才整合，但面临留不住人的困境
中国AI公司：DeepSeek、月之暗面等公司以极具竞争力的薪酬吸引海外华人AI人才回流

4.2 为什么顶级人才不再”忠诚”？

Shazeer的两次离开Google，揭示了一个深层趋势：在AI领域，顶级研究人员对单一雇主的忠诚度正在快速下降。

原因有几个：

技术迭代速度太快：一年前的技术路线可能今天就过时了，研究人员希望跟随最有前景的方向
创业文化的浸润：Shazeer自己就是创业者，他更习惯于根据机会而非组织忠诚度做决策
薪酬差距缩小：OpenAI、Anthropic等公司的薪酬已经可以与Google匹敌，甚至更高
使命驱动的吸引力：OpenAI的AGI使命对很多研究人员具有独特的吸引力

4.3 对行业的长期影响

人才战争的加剧，正在重塑AI行业的竞争格局：

大公司的”防守性收购”增加：Google对Character.AI的27亿美元交易可能只是一个开始
人才流动性成为核心竞争力：能够快速吸引和整合顶级人才的公司，将在技术竞争中占据优势
学术与产业的边界模糊：像Shazeer这样的研究者，同时具有顶尖的学术背景和产品化经验，成为最稀缺的人才类型

五、开发者视角：API消费者该如何应对？

5.1 模型竞争加剧 = 更好的产品

对于使用NixAPI等聚合平台的开发者来说，Shazeer的跳槽是一个利好消息。顶级人才的流动会加速技术竞争，最终受益的是API消费者。

OpenAI有了Shazeer，可能会在以下方面加速迭代：

更长的上下文窗口（Shazeer在长序列建模方面有深厚积累）
更高效的多模态处理
更低的推理延迟

Google失去Shazeer后，可能会加大在Gemini上的投入以证明”没有Shazeer也能行”，这同样会推动技术进步。

5.2 不要押注单一供应商

Shazeer的跳槽再次证明了一个原则：在AI领域，技术领导力的分布是高度动态变化的。今天的领先者可能明天就失去关键人才，今天的追赶者可能明天就实现突破。

对于依赖API的开发者，建议：

保持多供应商架构，避免对单一模型的深度依赖
关注NixAPI等聚合平台，灵活切换不同模型
将模型视为可替换的组件，而非核心资产

5.3 关注架构创新的信号

Shazeer的加入可能会带来OpenAI在架构层面的重大创新。开发者应该密切关注：

新的注意力机制变体
多模态统一架构的进展
推理效率的突破性提升

这些创新一旦落地，可能会改变当前的成本-性能平衡，为开发者创造新的机会。

六、总结：人才市场正在定义AI的下一个阶段

Noam Shazeer从Google到OpenAI的跳槽，不仅仅是一个人的职业选择。它是AI行业进入”人才定义竞争”阶段的标志性事件。

在这个新阶段，技术壁垒的半衰期越来越短，人才成为最稀缺的竞争要素。Google花了27亿美元试图锁定Shazeer，但失败了。OpenAI用使命和前景吸引了Shazeer，但代价是稀释股权和面临更严格的监管。

对于NixAPI的开发者用户，这场人才战争意味着：

更快的技术进步：顶级人才的竞争会加速模型迭代
更多的模型选择：不同公司会发展出差异化的技术优势
更低的长期成本：竞争最终会传导到定价端

最后，值得记住的是：Transformer架构是八位作者共同创造的。Shazeer的离开不会改变Google在这个架构上的深厚积累，但他的加入会让OpenAI在下一个架构创新中占据先机。

AI的竞争，从来不仅仅是算力和数据的竞争。归根结底，是人的竞争。而2026年6月18日，Noam Shazeer用他的选择，为这场竞争写下了新的一章。

参考资料：

"Attention Is All You Need"作者Noam Shazeer离开Google加入OpenAI