5月17日,摩尔线程与憨猴科技集团携手宣布了一项重大进展:依托摩尔线程的夸娥(KUAE)千卡智算集群,憨猴科技成功完成了7B、34B和70B大模型的分布式训练。此次合作不仅在兼容性和训练效率上达到了预期,还充分展示了夸娥智算集群在稳定性、高效能、易用性和高算力利用率方面的卓越表现。
据悉,整个训练过程经过了严苛测试,结果显示训练精度符合要求且过程持续稳定。这也标志着夸娥智算集群作为国产全功能GPU千卡千亿大模型预训练平台,具有显著的优势。这是憨猴科技首次使用国产AI算力完成这样高难度的大模型训练测试,为其今后服务于国有企业与运营商等关键领域,提供了更加坚实可靠的技术支持。
在此基础上,摩尔线程与憨猴科技集团还签署了战略合作协议。双方将在AI大模型和算力领域进行深入合作,通过摩尔线程的夸娥千卡智算集群与憨猴科技的AI智算产品及数字化解决方案相结合,共同探索国产AI算力的新应用场景和实际落地实践,进一步加速数智化产业的全面升级。
值得注意的是,摩尔线程已成功接入无问芯穹,并完成了千卡级别大模型训练,成为首家完成这一壮举的国产GPU公司。其夸娥千卡集群与无穹Infini-AI系统进行了系统级融合适配,并成功完成了LLama2 700亿参数大模型的训练测试。这一系列成就为后续的合作奠定了坚实的基础。
从技术规格上看,夸娥集群依托的是双路八卡GPU服务器MCCX D800。每个节点配置八块MTT S4000 GPU加速卡、两颗Intel第四代至强处理器、16 x 64GB内存、4 x 3.84TB NVMe SSD,以及双路400Gb IB和四路25Gb以太网网络。这一系列高性能配置为大规模GPU算力的建设和运营管理提供了强有力的支持。
在命名上,夸娥氏是我国古代神话传说中的大力神,其出处来自《愚公移山》,象征着力量与不屈精神。这一名字恰如其分地传达了该智算集群的高效、稳定和强大的计算能力。
此次合作不仅展示了国产AI算力的潜力,也为未来数智化产业的进一步发展提供了新的可能。通过双方的努力,国产AI大模型训练的平台基础正在逐渐形成,为国内相关领域的科技进步注入了新的活力。未来,随着摩尔线程与憨猴科技的持续合作,我们可以期待更多技术创新和行业突破,为国家科技自主创新带来更多贡献。