据CNBC报道,2月9日,谷歌旗下人工智能公司DeepMind首席执行官德米斯·哈萨比斯(Demis Hassabis)称,DeepSeek的人工智能模型"可能是中国最好的成果",但他补充称,"DeepSeek并没有展示新的科学突破。"
哈萨比斯在巴黎人工智能峰会前夕举行的谷歌活动先称赞了DeepSeek,"我认为这可能是我所见过的来自中国的最出色的作品",是一项令人印象深刻的工作。他表示,DeepSeek能够完成"极其出色的工程设计",并且"在地缘政治层面改变了局面"。
米斯·哈萨比斯法新社
DeepSeek打破了中国AI企业在大模型领域长期以来扮演的追随者形象,于1月26日同时登顶苹果App Store和谷歌Play Store全球下载榜首,上线18天,累计下载量突破1600万次,在覆盖的140个市场中持续保持领先地位。DeepSeek表示,训练其最新模型之一的成本则为560万美元(约合人民币4100万元),与此同时,谷歌Gemini Ultra模型的训练成本则为1.91亿美元。
市场开始对英伟达主导的算力神话产生动摇。DeepSeek在一份技术报告中称,它使用超过2000个英伟达H800芯片集群来训练其参数为6710亿的V3模型,而Meta训练参数量4050亿的Llama 3,用了16384块更强的H100显卡,花了54天。1月27日,英伟达股票暴跌近17%,市值蒸发5927亿美元(约合4.3万亿人民币),创下美股史上最大单日市值下跌纪录。
然而,哈萨比斯话锋一转,称DeepSeek从技术角度上并未实现重大变革。
DeepSeek采用了独特的DeepSeek-R1-Zero训练方法,通过纯强化学习实现训练,无需依赖监督微调和已标注数据,这一创新大大节省了时间和成本。同时,DeepSeek通过优化模型架构,减少计算层数、复用权重和参数共享,显著提高了模型效率,降低了对算力的需求。
哈萨比斯却对此评论称:"尽管被大肆宣传,但实际上并没有新的科学突破……它只是在使用已知的人工智能技术,围绕Deepseek 的炒作有点夸大其词了"。
哈萨比斯补充道,DeepMind的母公司谷歌本周向所有人发布的Gemini 2.0 Flash模型比其DeepMind自家的模型更高效。
DeepMind于2014年被谷歌收购,于2016年开发出AlphaGo,震动围棋圈。2022年,DeepMind推出通用人工智能模型Gato。目前,DeepMind正在与谷歌合作加强Gemini的能力。
哈萨比斯还谈到了"通用人工智能(AGI)"的前景。他将其描述为"一种具备人类所有认知能力的系统"。他说道"我觉得我们现在已经很接近了,也许我们距离拥有那样的系统只有5年左右的时间"。
据CNBC报道,哈萨比斯的言论与业内其他人士的看法不谋而合,他们都认为通用人工智能可能离现实更近了。
OpenAI首席执行官山姆·奥特曼表示,他"确信我们已经知道如何构建传统意义上所理解的人工通用智能(AGI)。"
但通用人工智能也存在诸多隐患,比如人类可能会失去对其所创造系统的控制。哈萨比斯说道:"我认为社会需要为此做好准备,并思考这将带来哪些影响。同时,要确保我们能从中获益,整个社会都能从中获益,但也要尽量降低一些风险。"