【文/观察者网 杨蓉】

中国人工智能(AI)初创企业DeepSeek的"异军突起",不仅给硅谷带来技术路线的冲击,震动了华尔街资本市场,也引发了美国对于AI人才流动的反思。

英伟达高级研究科学家禹之鼎日前在社交媒体透露,DeepSeek旗下一名关键工程师曾在这家美国AI芯片巨头实习且有望转正,但最终选择回国加入当时仍名不见经传的DeepSeek。这让美国知名国际政治学者、前助理国防部长格雷厄姆·艾利森感叹,美国未能真正吸引、留住人才,应为华盛顿敲响警钟。

"印象深刻"的决定

这名受到艾利森关注的DeepSeek研究员名为潘梓正。潘梓正在GitHub上公开的简历显示,他本科毕业于哈尔滨工业大学,硕士毕业于澳大利亚阿德莱德大学。2021年至2024年,他在莫纳什大学攻读计算机科学博士,2023年夏季曾在英伟达实习。

潘梓正(右)及他在DeepSeek-VL2多模态模型论文中的署名 GitHub

1月27日,DeepSeek登顶苹果美区应用商店免费App下载排行榜,潘梓正在社交平台X(原推特)上发帖庆祝,曾是他在英伟达实习期间导师的禹之鼎随即转发,同时披露了潘梓正加入DeepSeek前的故事。

禹之鼎回忆,英伟达当时原本正考虑给潘梓正全职工作机会,但他"毫不犹豫"选择回国加入DeepSeek,当时这家初创公司的多模态团队还只有3人。禹之鼎说,潘梓正后来在DeepSeek的多个重要项目中发挥了"关键作用",包括DeepSeek-VL2、DeepSeek-V3和DeepSeek-R1。

"我至今仍然对梓正当时的决定印象深刻……我个人非常为他的决定和取得的巨大成就感到高兴。"禹之鼎写道,"梓正的案例是近年来我所见到的一个非常典型的例子。我们许多最优秀的人才都来自中国,而这些人才并不一定只能在美国公司取得成功。相反,我们也从他们身上学到了很多。"

潘梓正发文庆祝DeepSeek超越ChatGPT下载量登顶的"现象级时刻",禹之鼎转发祝贺 X截图

"不是第一位,也不会是最后一位"

此后不到两年,DeepSeek就凭借开源模型-V3和推理模型R1在海内外一举成名。

V3的正式训练成本仅为557.6万美元,约为美国OpenAI GPT-4预算的1/20;R1性能比肩OpenAl o1,但将每百万token(自然语言处理和机器学习分割语言的基本处理单元,AI模型通过token对文本进行理解和处理)的价格从o1的60美元降至2.19美元,差价近30倍。

"R1证明了,突破性的AI进展不一定依赖于更大的计算集群和更庞大的数据集。"《麻省理工科技评论》评价道,"这些发现正在颠覆'更大即更好'的传统认知,为那些计算资源有限的机构和企业带来了新的可能。"DeepSeek最新模型发布后,英伟达市值单日蒸发近6000亿美元,美国上市科技企业总市值单日缩水约1万亿美元。

这让美国知名国际政治学者、哈佛大学肯尼迪政府学院创始院长、美国前助理国防部长格雷厄姆·艾利森(Graham Allison)不禁发问:"是谁错失了DeepSeek?"

艾利森 英国《新政治家》杂志网站

艾利森2月1日发文,形容DeepSeek对美国AI公司的颠覆堪比《圣经》中大卫杀死巨人哥利亚。"它也生动地提醒我们,美国必须严肃对待吸引和留住人才这件事,尤其是来自中国的人才。"

"为什么潘梓正--在开发DeepSeek的R1模型中发挥主导作用的工程师--会选择把自己的才能投入到中国,而不是美国,来创造这一非凡的技术突破?"艾利森说,"答案:因为他为之开发算法的硅谷公司没有为他提供机会,让他能在美国继续做这项工作。"

他就此提到同样从美国归国的中国"两弹一星"元勋钱学森--1950年代,钱学森受到美国麦卡锡主义风潮波及,被控同情共产主义,被"驱逐回国"--并断言潘梓正"不是美国失去的第一位超级人才,也不会是最后一位"。

艾利森认为,潘梓正"不是美国失去的第一位超级人才,也不会是最后一位" X截图

艾利森引述美国《华尔街日报》一篇专栏文章强调,中国的工程师总数是美国的9倍,STEM(科学、技术、工程、数学)毕业生数量更是美国的15倍。"在当前世界里,像钱学森、(英伟达CEO)黄仁勋或(特斯拉CEO)马斯克这样百万分之一的超级天才可以用脚投票,把他们的才华用在他们选择的任何地方。"

回国发展成趋势

事实上,总部位于美国的科技媒体Rest of World(下称"RoW")最近与多名中国科技行业人士对话后发现,放弃硅谷工作、选择在国内发展已经成为中国顶尖AI人才内部的一种趋势。

据一名在美国知名科技公司工作的的中国AI研究员向RoW透露,美国公司会聘请工程或数据处理能力强的中国实习生,以远程或在硅谷办公室的方式参与AI项目,且这些中国学生的工作往往"非常扎实"。

不过,该研究员表示,这些中国学生即使拿到转正机会,许多人还是选择回国。"让我感到惊讶的是,许多中国学生对在美国从事全职工作并不那么感兴趣。"

关于其背后原因,有业内人士向RoW指出,优秀毕业生在国内就业不仅生活成本更低、离家人更近,还利于个人发展,在职业生涯起步阶段就有机会负责关键工作。

此外,报道分析,也有部分原因在于美国近来移民政策对于华人并不友好,以及随着中国国内AI产业的蓬勃发展,相关领域毕业生在国内就业的选择变得更多,既有阿里巴巴这样的科技巨头,也有阶跃星辰、Minimax和零一万物为代表的初创公司。

中国AI人才库储备充足

根据美国保尔森基金会旗下的麦克罗波洛智库(Macro Polo)去年3月发布的一项研究,从本科院校来看,中国高校几乎培养了全球一半的顶尖AI研究人员;相比之下,仅有约18%研究人员来自美国大学。

研究还称,尽管美国在生成式AI领域率先取得了突破性进展,但其中很大一部分工作是由在中国接受教育的研究人员完成的。据悉,美国顶尖AI研究人员中,来自中国的研究人员占38%,美国人占37%。

在美国南加州大学研究中国科技法规的法学教授张湖月看来,DeepSeek的成功正"凸显了中国AI人才库的实力"。"大量能力强、技术娴熟的软件工程师为DeepSeek提供了支持。"张湖月说,"我相信,这种人才优势为中国下一阶段的AI发展奠定了坚实的基础。"

RoW称,借由国内高校、实验室以及美国科技巨头在华的研究机构(如总部设在北京的微软亚洲研究院),中国培养了一大批本土AI研究人员,DeepSeek更是从中优中选优。

报道举例说,DeepSeek-R1模型的核心贡献者宋俊潇,学生时代就已在同龄人中崭露头角。宋俊潇在香港科技大学攻读电子与计算机工程期间的博士生导师丹尼尔·帕洛马尔(Daniel Palomar)说,宋学习刻苦,"不知怎的,(DeepSeek)设法找到了精英中的精英"。