像人类幼崽一样,"华为离职天才少年"稚晖君带着他的新机器人来了。

点击查看大图

灵犀X2给稚晖君(右)讲解眼药使用说明

3月11日,上海智元机器人联合创始人、B站UP主@稚晖君(彭志辉)突然更新视频,正式发布智元双足智能交互人形机器人"灵犀X2"。据介绍,该机器人搭载情感计算引擎,集齐运动、交互和作业三方面智能。

首先,在运动方面,视频中的灵犀X2机器人展示出了诸多绝活。它可以踩滑板车、玩平衡车,甚至骑自行车,而这据称来自智元运控算法层面的突破。

点击查看大图

作为一个孩子,X2学习使用各种人类代步工具

稚晖君介绍,X2的运动控制已从传统模式转向learning驱动的强化学习,再结合深度强化学习和模仿学习算法优势,让X2学会了多种人类的动作。虽训练过程有波折,但它学会了使用人类代步工具,并持续学习进化,通过数据驱动算法范式解决运动瓶颈。为此,智元还为灵犀X2开发了一套基于Diffusion的生成式动作引擎,这使得机器人不仅四肢发达,头脑也并不简单。

而在交互方面,灵犀X2号称是第一台真正具备复杂交互能力的灵动机器人。除了基于语言大模型发展带来的沟通技能和机体材质的硬件突破,该机器人还有一个特别引人注意的地方,就是可以人类一样有呼吸起伏的动态,待机还会时不时扭头观察周围,如同人类幼崽一样可爱。稚晖君称,在语音和视觉之外,智元已经把动作模态也集成到了模型当中,因此才让X2有了生命感。

点击查看大图

灵犀X2会闲着没事抖腿,走路会挠屁股…

"它会有呼吸的韵律,会有跟人类一样的好奇心和注意力机制,有很多可爱的小动作,也有他自己的肢体语言"。稚晖君认为,真正的交互变革永远是以理解人性为坐标系,未来的机器人还将会拥有更多情绪表达的能力。

这里需要注意的是,稚晖君称目前正在尝试在人机交互方面引入一些全新的体验,比如远程裸眼3D交流。而根据视频显示,引入的裸眼3D指的是机器人头部显示技术,可以实现不建立物理层面的实物模型,仅通过显示就可以从不同角度看到机器人的拟人脸部细节。但从观感上,着实有点恐怖谷效应。另外,该机器人暂时使用了稚晖君本人声源,即一名成年男性声音进行对话交流,这与童趣可爱倒相去甚远。

点击查看大图

裸眼3D技术在机器人外观定制方面提供了一个选择,但…

灵犀X2动作灵巧,还具备高度交互功能能提供情绪价值,但并非只能做人类的趣味伙伴,它在实际作业方面也是颇有建树。稚晖君称,其终极期待是希望机器人能够成为构建社会生产力的重要分母。

视频中,灵犀X2展示了收纳的能力,还重现了三年前稚晖君用机械臂"缝葡萄"的神技。通常情况下,良好的缝合是外科手术成功的关键,而葡萄的果肉脆弱,果皮薄的不到一毫米,如何缝葡萄一直是许多外科医生们修炼技术的项目之一。

点击查看大图

灵犀X2展示缝葡萄。2021年10月,稚晖君曾因使用机械臂缝葡萄成功破圈,当时他还没有离开华为自主创业。

稚晖君表示,在过去一年里,智元已经初步找到了通往泛化作业智能的路径。基于这些成果,最终将操作智能的能力也迁移到了X2上。X2的本体支持很好的柔性阻抗控制,因此可以装配包括灵巧手在内的各种末端,当然也具备精细操作的能力。

"最终,我们希望机器人的生产力价值能够外溢到日常生活,让机器人的'吉祥三宝'成为现实,也就是所谓的保安、保姆和保洁",稚晖君说。