除了基于3D V-Cache堆叠缓存的升级版霄龙7003x系列处理器,AMD还为数据中心带来了另一款神奇:Instinct MI系列加速卡(加速器)。
这是AMD的第一款ExaScael百亿亿次级别加速卡产品,号称在同类产品中拥有世界上最快的HPC性能、AI性能。
Instinct MI200系列升级为新的CDNA2计算架构,搭配升级的6nm FinFET工艺,并使用2.5D EFB桥接技术,业内首创多Die整和封装(MCM),内部集成了两颗核心。
还有第三代Infinity Fabric总线互连技术,带宽100GB/s,最多8条与第三代霄龙处理器互通,实现CPU/GPU内存一致性。
软件API支持OpenMP、OpenCL、HIP、ROCm Open、TensorFlow、PyTorch、Kokkos、RAJA。
新系列分为两款型号,Instinct MI250X集成了220个计算单元、14080个流处理器核心,最高频率1.7GHz,并有第二代矩阵核心,峰值性能为:FP16半精度383TFlops、FP32单精度/FP64单精度47.9TFlops、FP32单精度/FP64双精度矩阵95.7TFlops、INT4/INT8/BF16 383TFlops。
内存/显存搭配8192-bit位宽的128GB HBM2e,频率1.6GHz,峰值带宽3276.8GB/s,并支持全芯片ECC。
整卡采用OAM模块形态(未来也 会推出PCIe扩展卡形态),支持PCIe 4.0 x16,被动散热(系统散热),典型功耗500W,峰值功耗560W。
Instinct MI250精简为208计算单元、13312流处理器核心,各项性能指标也顺应下降约5.5%,其他规格完全不变。
AMD宣称,Instinct MI200系列性能双精度性能比竞品高出最多4.9倍,比上代提升最多4倍。
MI200系列已经赢得了多项客户解决方案,包括ATOS BullSequana X410-A5 2U1N2S(双CPU四GPU)、戴尔PowerEdge R7525(双CPU三GPU)、技嘉G262-Z00(双CPU四GPU)、HPE Cray EX235a(单CPU四GPU)等等,其他客户还有话说、联想、KOI Cmputers等等。
尤其是与美国国防部橡树岭国家实验室、HPE合作打造的超级计算机“Frontier”,采用第三代霄龙处理器、MI250X加速卡,峰值算力高达150亿亿次浮点计算每秒。
关键词: 加速 MI250X MI250 Instinc
凡注有"环球传媒网"或电头为"环球传媒网"的稿件,均为环球传媒网独家版权所有,未经许可不得转载或镜像;授权转载必须注明来源为"环球传媒网",并保留"环球传媒网"的电头。