3套曙光scaleX万卡超集群同时落地,构筑国家级AI算力新基座

2月5日,由中科曙光提供的3套万卡超集群系统在国家超算互联网郑州核心节点同时上线试运行,成为全国首个实现3万卡部署、且实际投入运营的最大国产AI算力池,全面覆盖万亿参数模型训练、高通量推理、AI for Science等大规模AI计算场景。

《3套曙光scaleX万卡超集群同时落地,构筑国家级AI算力新基座》

从概念落到实用

人工智能大模型正向万亿级参数、多模态、世界模型全速迈进,对算力基础设施提出了前所未有的挑战。去年12月,scaleX万卡超集群在HAIC大会首次真机亮相,不到2个月后,即以超3万卡的AI算力规模落地。这也标志着国产万卡集群已正式迈入规模化部署与实战应用的新阶段。

这背后是复杂的系统工程。中科曙光以系统性创新,攻克高速互联网络、存算传紧耦合设计、高密供电与散热、统一资源高效调度等关键技术难题。

从自强走向众惠

AI产业蓬勃发展,全球智能算力需求爆发。算力基础设施亟需具备生态兼容与弹性扩展等特征,以高效支撑多元应用场景、大幅降低产业使用门槛。

曙光scaleX万卡超集群基于AI计算开放架构,可全面兼容CUDA等主流软件生态,支持多品牌国产加速卡混合部署,大幅降低开发者迁移适配门槛,更具备向十万卡、百万卡规模的灵活扩展,更好契合产业规模化发展需求。

基于这些优势,scaleX万卡超集群成为国家超算互联网郑州节点的核心AI算力支撑,并依托国家超算互联网实现一体化算力调度,从而可为全球用户提供通用、易用、高效、普惠的中国AI算力。

从算力基石到创新沃土

培育繁荣的AI产业,需要构建协同共生的创新生态。scaleX万卡超集群已完成400多个主流大模型、世界模型的适配优化,依托国家超算互联网,更可接入上千款应用,链接更多AI产业生态伙伴,实现“算力+应用”一体化交付。

实际应用中,scaleX万卡超集群持续为多场景提供深度赋能:针对超大规模模型训练,支持万亿参数模型的整机训练与容错恢复;面向高通量推理场景,已服务于多家头部互联网用户的核心智能化业务,并通过联合深度优化持续提升推理效能;在AI for Science领域,支撑国内某材料研发大模型登顶国际权威榜单,助力国内顶级科研团队将蛋白质研究效率提升3-6个数量级等;同时搭配OneScience科学大模型一站式开发平台,大幅降低多学科交叉研究的创新门槛。

“智能化的浪潮正以前所未有的力量重塑世界。”中科曙光高级副总裁李斌表示,“我们将以郑州核心节点上线为起点,继续深化技术研发与应用实践,推动国产智能算力更高效、更稳定、更普惠地服务于经济社会发展的各个领域。”