国内大模型竞争,加速转向深度应用。

5月20日,京东云城市大会在上海举行。会上,京东云发布JoyScale AI算力平台、JoyBuild大模型开发计算平台、JoyAgent智能体2.0等九大产品,以及医疗、工业、金融三大垂直行业一体机,助力企业全面重构AI基础设施,生成企业专属数字员工,加速迈向深度应用。

京东集团技术委员会主席、京东云事业部总裁曹鹏表示,"随着深度应用加速来临,数字员工的上岗率将成为衡量一个企业先进性的标准。有多少工作是AI完成的,决定了企业未来能跑多快。新一代Agent成为深度应用的代表,京东云JoyAgent2.0正在帮助企业生成专业数字员工。同时,大规模应用爆发,也将推动AI基础设施迈向标准化,AI Infra1.0已经具备。"

如何让大模型全面走向企业的深度应用?京东云提出了三个观点:

其一,作为最快速部署大模型的方式之一,一体机是尝鲜企业级AI的最佳路径。京东云透露,过去三个月,"开箱即用"的京东云大模型一体多省市全面铺开,全国规模化落地突破500台。

其二,深度应用时代全面开启,智能体是深度应用方面最具代表性的方向。京东云认为,虽然"超级应用"还有距离,但聚焦企业端的"深度应用"已奔涌而至,正在加速渗透到需要投入大量人力进行重复劳动的场景。随着大模型及智能体技术的持续升级,行业正加速迈向深度应用阶段。

数据显示,近三个月京东大模型服务调用量爆发式增长,环比提升200%;超1.4万个智能体在京东内部运行,解决超18%的工作内容,各类大模型应用已深入到京东零售、物流、医疗等细分业务场景,为超50万商家、超38万快递小哥、超5万副主任以上级别医生、超2万采销运营、超1万研发提供助力。

京东云宣布,成长于京东自身业务系统的JoyAgent 智能体 2.0全新升级, 基于混合代理模型(Mixture-of-Agents,MoA),融合大小型模型的优势,通过规划推理构建动态DAG执行引擎,大幅提升任务执行效率。

其三,技术栈迎来全面重构,AI基础设施将走向标准化。

京东云认为,随着大模型应用的深入,以CPU为中心的架构在支持AI原生应用上面临挑战,需要以GPU为中心重塑基础设施;此外,面对激增的推理需求,计算资源持续增加,企业需要思考资源投入产出的问题,都指向需要一套AI Native的基础设施。

在大模型开发应用方面,JoyBuild支持多类模型的调优开发,内置20余种开源模型和丰富的数据集,提供100余种算法和工具链。围绕开源模型蒸馏需求的不断增加,可以帮助客户根据自身业务特征,用自有数据进行大模型的蒸馏,快速开发专属大模型。

京东大模型开发计算技术相关论文被Nature收录,为国内首次系统性解决开放环境下大模型开发效率难题,这套技术也支撑了JoyBuild应用。此外,JoyBuild推理引擎基于大规模专家并行推理集群技术,提升高并发下并行度,实现单Token推理成本降低80%。

在计算方面,京东云发布全新的JoyScale AI算力平台--以GPU为核心,高效异构计算,强大推理性能。其具备两大核心优势:一是算力性能,一是灵活的异构算力管理。

公开资料显示,JoyScale支持单集群万卡调度、全局超10万卡调度能力,支持跨智算中心横向扩展,通过软硬件协同优化,将大模型算力利用率MFU从45%提升至75%。它全面适配十余家国产算力,支持异构算力统一纳管、精细化运维,通过集群算力池化调度,提升集群利用率70%。

在存储方面,云海AI存储基于京东全自研的引擎,对AI训练语料的随机访问达到1000万级,单集群支持TB级超大带宽,能有效支持千亿级参数AI大模型的训练。云海针对性地提供了原生 KV Cache 特性,支持主流推理框架,以存代算的模式显著提升了推理性能,长文推理成本下降 40%,长文/多轮对话响应延迟降低 60%。

本文系观察者网独家稿件,未经授权,不得转载。