蚂蚁披露大模型研发路线：全栈布局、长线发展、面向产业

(资料图片仅供参考)

9月8日，在上海举办的外滩大会上，蚂蚁集团正式发布了金融大模型，并开源生成式AI编程平台CodeFuse。蚂蚁集团首席技术官、平台技术事业群总裁何征宇介绍，蚂蚁大模型走纯自研的技术路线，以全栈布局、长线发展为原则，以创造产业价值为目标。为此，蚂蚁坚决投入大模型底层基础设施，目前已建成万卡AI集群，训练效率领先行业，为大模型产业化应用提供有力支撑。

何征宇介绍，蚂蚁一直以来坚持核心技术自主创新，2022年底正式立项大模型研发，目前已形成从基础大模型到行业大模型以及产业应用的全栈布局。

今天发布的蚂蚁金融大模型基于蚂蚁基础大模型，针对金融产业深度定制。何征宇介绍，蚂蚁基础大模型平台具备万卡异构集群，其中千卡规模训练MFU可达到40%，集群有效训练时长占比90%以上，RLHF训练在同等模型效果下训练吞吐性能相较于业界方案提升3.59倍，推理性能相较于业界方案提升约2倍，处于业界先进水平。

何征宇表示，未来蚂蚁将持续探索和精进大模型的五大能力方向。一是，建设高质量的数据标注团队，沉淀高质量数据体系；二是，攻坚基础大模型算法，以及高效绿色工程能力，提升模型逻辑推理等能力；三是，从通用语言大模型到通用多模态大模型，从一般通识走向全面专业；四是，建设高效的大模型评测标准和评测体系，加快大模型迭代速度；五是，建设大模型安全能力，保障大模型健康可持续发展。

在产业端，蚂蚁将结合自身能力优势和大模型技术特征，重点探索金融、科技服务等领域的落地应用。

标签：