全国超30个城市加速智算中心建设,4U机箱相比2U多出近一倍高度空间,是高密度AI算力部署的首选。红芯聚创® HG9680 昇腾AI一体机基于鲲鹏920处理器的旗舰级4U AI服务器,搭载8卡昇腾910B模组并行计算,在有限空间内实现旗舰级算力密度。 红芯聚创® HG9680 昇腾AI一体机采用8卡全互联拓扑,每张加速卡与其他7卡均有高速通道,无需交换芯片跳转,真正实现无瓶颈互联。HCCS是华为自研高速互联技术,专为解决GPU卡间通信问题而生。相比PCIe需CPU中转(延迟数百纳秒到几微秒),HCCS实现卡间直接通信,延迟仅数十纳秒。昇腾910B通过HCCS总带宽达392GB/s,配合HCCL高性能集合通信库,支持AllReduce、Broadcast等通信原语,在多卡并行训练中高效完成梯度同步。 昇腾910B单卡配备64GB HBM ECC显存,带宽高达1.6TB/s;8卡模组总计512GB显存,通过HCCS实现逻辑统一寻址,大模型训练数据在多卡间共享,跨卡搬运损耗大幅降低。 右侧蓝色区域为HCCS 高速互联控制器 HCCS硬件架构图(8p) 8卡昇腾910B模组约2800W的功耗,加上鲲鹏920功耗,对整机的散热提出了极高要求。红芯聚创® HG9680 昇腾AI一体机通过分区散热与气流优化,在4U空间内有效压制高热功率。鲲鹏920基于ARM架构,能效比显著优于传统X86方案。 扩展方面,红芯聚创® HG9680 昇腾AI一体机最大支持32个DDR4内存槽位、最多16个硬盘位及多个PCIe插槽,可供灵活配置。 昇腾910B半精度FP16算力达280TFLOPS,整数精度INT8达560 TOPS。在大模型推理任务中表现优异,8卡HCCS全互联下接近线性加速比。红芯聚创® HG9680 昇腾AI一体机面向大模型推理、智慧城市、算力池化等场景,昇腾异构计算架构CANN已支持50余个主流大模型。


4U机箱塞下8卡昇腾910B 模组!如何实现全互联无瓶颈?
分类:企业动态
发布时间:2026年06月02日
相关推荐
AI趣味出圈!红芯携算力成果亮相市级科技活动周
2026.06.03
数聚红芯包场!请所有员工看《给阿嬷的情书》
2026.06.03
4U机箱塞下8卡昇腾910B 模组!如何实现全互联无瓶颈?
2026.06.02
实测出炉!昇腾 910B 部署 DeepSeek-V4 性能表现
2026.05.28
破解大模型训练瓶颈,昇腾910B 以 1600GE RoCE 释放算力潜能
2026.05.28
红芯PRO6000D液冷工作站,静音算力直达办公区
2026.05.26
红芯方案亮相 HACI 国际论坛,推动HPC智算创新
2026.05.25
4卡方案怎么选?红芯液冷工作站VS服务器,不同场景最优解
2026.05.18
首批入选!数聚红芯携手华为,共拓广东政企合作新征程
2026.05.18