AI训练和推理

专业AI解决方案,实现AI高效办公

金融高频交易

融合解决方案,建筑高频交易算力基座

设计和仿真

解决不同计算场景,不同数据形态的设计渲染、仿真问题

高性能计算

提供高性能、高算力集群方案

存储

解决I/O性能读写瓶颈,高可靠数据安全

数据中心和云计算

从整机柜到数据中心,提供全面的液冷解决方案

4U机箱塞下8卡昇腾910B 模组!如何实现全互联无瓶颈?

分类:企业动态

发布时间:2026年06月02日

全国超30个城市加速智算中心建设,4U机箱相比2U多出近一倍高度空间,是高密度AI算力部署的首选。红芯聚创® HG9680 昇腾AI一体机基于鲲鹏920处理器的旗舰级4U AI服务器,搭载8卡昇腾910B模组并行计算,在有限空间内实现旗舰级算力密度。



8卡全互联拓扑



红芯聚创® HG9680 昇腾AI一体机采用8卡全互联拓扑,每张加速卡与其他7卡均有高速通道,无需交换芯片跳转,真正实现无瓶颈互联。HCCS是华为自研高速互联技术,专为解决GPU卡间通信问题而生。相比PCIe需CPU中转(延迟数百纳秒到几微秒),HCCS实现卡间直接通信,延迟仅数十纳秒。昇腾910B通过HCCS总带宽达392GB/s,配合HCCL高性能集合通信库,支持AllReduce、Broadcast等通信原语,在多卡并行训练中高效完成梯度同步。


昇腾910B单卡配备64GB HBM ECC显存,带宽高达1.6TB/s;8卡模组总计512GB显存,通过HCCS实现逻辑统一寻址,大模型训练数据在多卡间共享,跨卡搬运损耗大幅降低。

右侧蓝色区域为HCCS 高速互联控制器

HCCS硬件架构图(8p)





4U工程设计:散热与扩展

8卡昇腾910B模组约2800W的功耗,加上鲲鹏920功耗,对整机的散热提出了极高要求。红芯聚创® HG9680 昇腾AI一体机通过分区散热与气流优化,在4U空间内有效压制高热功率。鲲鹏920基于ARM架构,能效比显著优于传统X86方案。


扩展方面,红芯聚创® HG9680 昇腾AI一体机最大支持32个DDR4内存槽位、最多16个硬盘位及多个PCIe插槽,可供灵活配置。


性能收益与典型场景

昇腾910B半精度FP16算力达280TFLOPS,整数精度INT8达560 TOPS。在大模型推理任务中表现优异,8卡HCCS全互联下接近线性加速比。红芯聚创® HG9680 昇腾AI一体机面向大模型推理、智慧城市、算力池化等场景,昇腾异构计算架构CANN已支持50余个主流大模型。

当前,智算中心建设正从 "规模扩张" 向 "效能提升" 转变,高密度、低延迟、高性价比的算力产品成为市场刚需。红芯聚创® HG9680 昇腾AI一体机凭借其卓越的工程设计和全栈国产化优势,为大模型推理、智慧城市、算力租赁等场景提供了理想的算力解决方案。


如需了解红芯聚创® HG9680 昇腾AI一体机的详细技术参数、定制化配置方案或获取测试样机,欢迎联系数聚红芯专业团队,我们将为您量身打造最适合的 AI 算力基础设施方案。

lizixuabal1.jpg

专注于智能计算解决方案

专业的顾问服务

耐心的答疑解惑

全国统一服务热线:400-869-9865

邮箱:business@linkupai.cn

立即咨询

我们欢迎任何人联系我们,请描述您的问题,我们的团队将在3个工作日内与您取得联系。或拨打我们的热线 400-869-9865 立即咨询。

*

*

*

我们承诺收集您的这些信息仅用于与您取得联系,帮助您更好的了解我们的合作计划。
发送即代表您同意我们的《隐私政策》