项目背景
大象声科(Elevoc)2017年成立于深圳,是全球领先的机器听觉人工智能企业,专注于智能语音增强与交互解决方案研发。公司基于计算听觉场景分析理论(CASA)及深度学习技术(DL),为智能手机、PC、可穿戴设备、智能车载、智能家居及VoIP云通讯等领域提供前沿语音技术,致力于打造自然高效的人机交互体验。
挑战痛点
算力与显存瓶颈制约实时处理性能
原硬件的算力以及原有显存的不足,导致在处理192kHz声纹时因过高延迟无法满足实时交互需求,还迫使了特征分片加载。
扩展性与多卡协同效率不足
原节点最大4 GPU限制算力线性扩展,四卡的拓展性无法支持大规模的声纹模型训练,兼容上难以实现计算-存储协同卸载。
高负载下的系统可靠性与运维风险
GPU温度>85°C引发降频,非冗余电源导致电压敏感场景数据丢失风险,且传统维护模式需停机更换部件,影响业务连续性。
解决方案
算力升级和能效优化方案
部署数聚红芯HG8380S服务器,搭载10张NVIDIA A800显卡,800GB大容量显存,解决语音模型训练与推理的高并发需求。
数据处理延迟与未来兼容方案
支持 NVMe/SATA/SAS 多协议混合接入,总计24个热插拔盘位。从结构化语音数据采集到并发写入训练样本,数据吞吐无阻、扩展无忧。
高可靠供电与智能散热解决方案
通过8热插拔风扇结合机箱结构化散热,4×2000W钛金冗余电源,实现99.99%可用性,保障高负载稳定运行。
项目收益
依托顶尖机器听觉科学家团队和深度学习技术,为多种智能设备提供先进的语音增强和交互解决方案,推动人机交互体验向更自然的方向发展。面临研发挑战时,公司通过升级至基于INTEL双路三代至强平台的数聚红芯HG8380S十卡GPU服务器,搭载10张NVIDIA A800显卡,显著提升了音频处理的计算能力和效率。这一技术革新不仅加速了项目进程,减轻了团队压力,也为公司在智能语音领域的领先地位和未来发展奠定了坚实基础。
客户评价

“ 智能语音解决方案显著提升了我们的音频处理效率,其专业团队和领先技术为产品快速落地提供了强大支持!”
