性能1.55倍于NV 350W RTX！寒武纪上线全新AI训练GPU

发布时间：2022-03-23 00:14:12 所属栏目：业界来源：互联网

导读：中国本土AI创新企业寒武纪正式发布了新款训练加速卡MLU370-X8，搭载双芯片四芯粒封装的思元370，集成寒武纪MLU-Link多芯互联技术，主要面向AI训练任务。寒武纪MLU370-X8智能加速卡首次整合了双芯片四芯粒的思元370，也就是每张卡两颗芯片，每颗芯片内封装两

　　中国本土AI创新企业寒武纪正式发布了新款训练加速卡“MLU370-X8”，搭载双芯片四芯粒封装的思元370，集成寒武纪MLU-Link多芯互联技术，主要面向AI训练任务。

　　
　　寒武纪MLU370-X8智能加速卡首次整合了双芯片四芯粒的思元370，也就是每张卡两颗芯片，每颗芯片内封装两个Die，因此可提供两倍于思元370加速卡的内存、编解码资源。

　　架构基于Cambricon MLUarch03，支持AI训练加速中常见的FP32、FP16、BF16、INT16、INT8、INT4数据格式计算，峰值性能分别为32TFlops、96TFlops、96TFlops、128Tops、256Tops、512Tops。
　　
　　通过MLU-Link多芯互联技术，提供卡内、卡间互联功能，并专门设计了MLU-Link桥接卡，可实现4张加速卡为一组、8颗思元370芯片全互联。

　　性能1.55倍于NV 350W RTX！寒武纪上线全新AI训练GPU

　　根据官方数据，Cambricon NeuWare SDK实测，在常见的4个深度学习网络模型上，MLU370-X8单卡性能与主流350W RTX GPU相当。

　　多卡加速，借助MLU-Link多芯互联技术、Cambricon NeuWare CNCL通讯库的优化，8卡环境下达到更优的并行加速比，YOLOv3、Transformer、BERT、ResNet101训练任务中，8卡并行平均性能达350W RTX GPU的155％。

　　寒武纪未透露对比的NVIDIA 350W RTX GPU是哪一款，从规格来看，350W功耗的目前只有RTX 3090、RTX 3080 Ti。

　　当然，一个是专用AI加速卡，一个是GPU通用游戏卡，其实没有太大可比性。

　　MLU370-X8产品定位中高端，与高端训练产品思元290、玄思1000相互结合，进一步丰富了寒武纪的训练算力交付方式，同时与基于思元370芯粒(chiplet)技术构建的MLU370-X4、MLU370-S4智能加速卡协同，形成完整的云端训练、推理产品组合。

（编辑：核心网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

壹号本新款 ONE XPLAY	特斯拉前 CTO 电动汽车
华硕公布新款天选3 搭	主流显卡最新场批价曝