(原文发布在美国彭博社,原标题:"中国的DeepSeek说明了为什么特朗普很难打赢贸易战。"译文仅供读者参考,不代表观察者网观点。)
【文/泰勒·考恩】
如今,人工智能领域出现突破是如此的普遍,以至于很难区分真正重要与无意中出现的突破。但最近的一次事态发展值得特别关注:来自中国的全新系列大语言模型DeepSeek-V3的出现。这件事对中美贸易的影响与在科技领域的影响一样大。
笔者已经对DeepSeek进行了好几天的测试,这是笔者过去几年中测试过的数十个大语言模型中最好的之一。它快速、容易上手,且有一个免费的版本。虽然在应对复杂或晦涩的问题上无法与美国最好的大语言模型相提并论,但笔者会把它归入一流的一档。其他人,包括测试人员也持同样的看法。
Deepseek-V3与多个国内外大模型的测试数据对比。 "Deepseek"公众号
DeepSeek还有几个值得注意的地方。首先,它来自一家对冲基金,而不是一家科技公司(不过,这样的分类方式可能也需要更新了)。其次,据报道,它的训练成本非常低,估计只有约550万美元,还不包括非计算成本(non-compute costs),这类统计通常都会排除那部分成本。
也许最引人注意的是,DeepSeek并没有使用质量最高级的半导体芯片。美国拜登政府一直在努力限制向中国出口这类芯片,希望减缓中国在人工智能和相关军事技术应用方面的进步。由于无法获得最新的尖端芯片,DeepSeek不得不寻找其他更便宜的方法来训练其模型。
笔者过去曾支持这类贸易限制措施,理由是人工智能技术事关国家安全。但笔者现在认为,这项禁令设置的目标过高以至于难以实现。禁令也许可以让中国在人工智能领域的进步推迟数年,但也间接导致了中国的一项重要创新--即DeepSeek的诞生。
现在全世界都知道了,只需花费相对较少的资金就足以训练出质量相当高的人工智能系统。对于俄罗斯、伊朗、巴基斯坦和其它国家来说,这可能会让发展类似的人工智能系统成为现实的愿景。可以想象,来自外国的亿万富翁也有能力发起类似的项目,虽然网罗技术人才会是一个制约因素。无论中国的人工智能系统及其潜在用途会带来哪些"风险",其它国家在DeepSeek启发下发展的分支项目可能会更加令美国人担忧。
无论如何,各国几乎肯定能找到更便宜的构建人工智能系统的方法。但这里涉及一个权衡:美国的政策成功地拖延了中国将高质量芯片用于人工智能系统的能力,这相应地给美国带来了国家安全利益,但同时也加速了不依赖高质量芯片却有效的人工智能系统的发展。
这样的权衡最终是否会证明对美国有利,还需要时间观察。但这种权衡不仅仅体现在狭义的层面,尽管目前围绕DeepSeek的动机、定价策略、未来规划以及"与中国政府的关系"依然有许多尚未解答或无法回答的疑问,但在更广泛的层面,这种权衡也面临着不确定性。
借用奥地利经济学家路德维希·米塞斯(Ludwig Mises)的一句话:"政府干预会产生重要的、意想不到的次生后果。"要看一项政策是否奏效,不仅要考虑其直接影响,也要看它的二阶甚至三阶影响。
美国芯片禁令产生的一个次生效应是,它可能会鼓励一些中国使用者通过其它国家的第三方获得高质量芯片,或者租用非中国的、使用了高质量芯片的人工智能系统。在这种情况下,中国企业根本不需要购买芯片,至少在某些应用上不需要。美国的对策是更进一步地施加行业限制--但它真的能对全球半导体市场进行微观管理吗?笔者越来越表示怀疑。
美国当选总统特朗普的政府在考虑升级对华贸易措施时,最好仔细研究一番其前任政策带来的意外后果。可以肯定的是,一部分(而非全部)非人工智能贸易限制措施自有其国家安全层面的理由。但任何政策带来的直接影响很少是故事的全部结局。
例如,如果联邦政府决定限制一款在美国销售的中国商品或者服务,或选择对其征税,中国可以尝试通过第三方更换名称,销售同一款商品,而许多亚洲国家愿意助其一臂之力。擅长钻规则漏洞的企业家往往比政府官僚行动更加迅速。
抽象地说,关于"国家安全"的观点自有其说服力。但在现实中,以保护国家安全为目标的政策很难设计得周全。重要的是思考如何让实践更好地符合理论。