英特尔第五代EmeraldRapids64核和GraniteRapidsXeonCPU性能揭晓
英特尔公布了即将推出的第五代EmeraldRapids和下一代GraniteRapidsXeonCPU的最新性能和内部预测。
英特尔第5代EmeraldRapidsXeon64核CPU性能比56核SapphireRapids高出40%
在SC23期间谈到其XeonCPU时,英特尔公布了新的性能指标,其中包括即将推出的第五代EmeraldRapids的实际结果以及对其下一代GraniteRapidsXeonCPU的预测。该芯片制造商将结果与其自己的SapphireRapids第四代芯片进行了比较,同时还展示了XeonMaxCPU与AMDEPYCGenoa96核芯片的HPC指标。
英特尔第五代EmeraldRapids64核和GraniteRidgeXeonCPU性能揭晓2
从细节开始,英特尔第五代EmeraldRapidsCPU将与EagleStream平台上的SapphireRapidsCPU引脚兼容。它们采用相同的LGA-4677插槽,主要提供优化设计,几乎没有额外的核心/线程、更大的缓存池,并专注于更高的每瓦性能。
该公司强调,EmeraldRapidsXeonCPU将提供工作负载优化的性能和节能计算。同时,添加更快的DDR5-5600内存应该会带来更高的带宽和传输速度。第五代Xeon还将提供CXL1.0和2.0支持以及多达80个PCIeGen5.0通道。英特尔宣称性能提升了40%。详情如下:
英特尔EmeraldRapids(至强8592+64核)与SapphireRapids(至强8480+56核):
AI语音识别:1.4倍提升
HPCLAMMPS(铜):1.4倍提升
媒体转码(FFMPEG):1.2倍提升
第五代Xeon“EmeraldRapids”CPU的一些预期功能包括:
LLC缓存高达3倍
提高内存速度
更高的CPU核心数量(最多64个核心)
CXLType3高带宽接口
工作负载优化(英特尔AE)
优化电源模式
通用性能/功率提高高达17%
使用英特尔加速器引擎卸载CPU内核以提高电源效率
推理和训练方面的性能大幅提升
用于内置AI加速的IntelAMX
通过优化的软件堆栈进行开箱即用部署
英特尔第五代EmeraldRapidsXeonCPU规格“初步”:
CPU名称 修订/步进 核心/线程 缓存 基础/增强(最大) DDR5支持 TDP
至强铂金8592V QS/A1 64/128 320MB 2.0/3.9GHz 4TBDDR5-4800(8通道) 330W
至强铂金8592+ QS/A1 64/128 320MB 1.9/3.9GHz 4TBDDR5-4800(8通道) 350W
至强铂金8580Q QS/A1 60/120 300MB 2.1/4.0GHz 4TBDDR5-5600(8通道) 350W
至强铂金8580 QS/A1 60/120 300MB 2.0/4.0GHz 4TBDDR5-5600(8通道) 350W
至强铂金8581V QS/A1 60/120 300MB 2.0/3.9GHz 4TBDDR5-5600(8通道) 270瓦
至强铂金8570 QS/A1 56/112 300MB 2.1/4.0GHz 4TBDDR5-5600(8通道) 350W
至强铂金8571N QS/A1 52/104 300MB 2.4/4.0GHz 4TBDDR5-5600(8通道) 300W
至强白金8558P QS/A1 48/96 260MB 2.7/4.0GHz 4TBDDR5-4800(8通道) 350W
至强铂金8568Y+ QS/A1 48/96 300MB 2.3/4.0GHz 4TBDDR5-5600(8通道) 350W
至强铂金8558 QS/A1 48/96 260MB 2.1/4.0GHz 4TBDDR5-5200(8通道) 330W
至强白金8558U QS/A1 48/96 260MB 2.0/4.0GHz 4TBDDR5-4800(8通道) 300W
至强金牌6554S QS/A1 36/72 180MB 2.2/4.0GHz 4TBDDR5-5200(8通道) 270瓦
英特尔下一代GraniteRapidsP核至强CPU性能预测
英特尔还公布了即将推出的GraniteRapidsXeonCPU的内部性能预测,该CPU将仅提供P核版本,而SierraForest将采用E核架构并提供多达288个核心。这些芯片将与下一代BirchStream平台兼容,该平台有两种不同的插槽:LGA4710和LGA7529。该公司确认GraniteRapidsXeonCPU将提供更多的核心数量、频率和最新的IntelAMX(高级矩阵扩展)。GraniteRapids还将添加FP16,以扩大对基于AI的开发人员的精确支持。该平台将提供12通道MCRDIMM支持,以解决受内存限制的较大LLM模型。
在性能方面,针对现有第四代SapphireRapidsCPU的内部评估表明,GraniteRapidsXeon芯片将在AI推理(DeepMD+LAAMPS)方面提供2.9倍的提升,在内存带宽方面提升2.8倍,在AI方面的性能提升高达3倍工作负载。这些只是粗略的估计,最终性能可能会有所不同。
56核XeonMaxCPU可与96核AMDEPYCGenoa竞争
最后,英特尔还展示了其XeonMax9480CPU的一些HPC性能基准,该CPU配备56核和64GBHBM内存,与配备96核的AMDEPYC9654进行对比。XeonMaxCPU的性能提升高达30%。EPYC9645零售价为11,805美元,而XeonMax9480零售价为12,980美元。
两款CPU的额定功率均为360/350W,但SapphireRapidsCPU确实消耗更高的功率,因此可能会比AMD解决方案降低TCO。此外,AMD还提供Genoa-X风格的3DV-Cache增强型产品,可以在这些带宽受限的工作负载场景中提供具有竞争力的性能。
尽管如此,英特尔将于12月14日推出第五代XeonEmeraldRapidsCPU系列,而GraniteRapidsCPU将在SierraForest之后不久于2024年下半年首次亮相。