栏目分类
热点资讯
你的位置:科技前沿网 > 数字趋势 > 深度剖判:聊聊英特尔与AMD各自不同的CPU整合想路

数字趋势

深度剖判:聊聊英特尔与AMD各自不同的CPU整合想路

发布日期:2024-12-08 06:56    点击次数:135

深度剖判:聊聊英特尔与AMD各自不同的CPU整合想路

作家:毛烁

2017年,就在AMD推出代号为Naples的第一代Epyc处理器之后不久,英特尔就曾玩笑称其竞争敌手果决“向隅而泣”,需要把一大堆台式机芯片“粘合”起来才能在阛阓上扞拒求存。

缺憾的是,如今这只回放镖又狠狠砸在了英特尔我方的脸上。因为短短几年之后,这家x86就运行寻求我方的一套芯片整合决策。

从本年运行,英特尔的至强6处理器运行分阶段推出,这意味着英特尔第三代多芯片至强和首款秉承与AMD私有异构芯片架构的数据中心处理器也走上了我方当初也曾哄笑过的本阐发线。

天然英特尔最终也不得不在AMD的芯片政策前低下高傲的头,但接管的智力却与这位老敌手天渊之别。

克服掩模版极限

在深远参谋这个话题之前,咱们先来聊聊为什么新一代CPU假想纷繁废弃传统单片架构。这主要归结于两简略素:掩模版极限与产能容量。

总的来讲,在制程工艺本领缺少症结校正的情况下,更多中枢必须对应着更多芯片。然而,芯片的物理尺寸面临客不雅极限——咱们将其称为掩模版极限,大致为800泛泛毫米。一朝达到这一极限,那么连续扩张狡计材干的唯独智力即是引入更多芯片。

咱们当今仍是看到宽广居品(不单是是CPU)在秉承这种智力,它们将两块大型芯片塞进并吞封装之内。Gaudi 3、英伟达的Blackwell乃至英特尔的Emerald Rapids至强都是这种本阐发线的典型代表。

多芯片假想的问题在于,各芯片之间的桥接机制赓续会形成传输带宽瓶颈,并很可能引入荒谬的延长。天然情况还不至于像把职责负载漫衍到多个插槽那么严重,但履行影响也已相当权贵,因此一部分芯片假想师更倾向于使用较少数目的大型芯片来收场狡计材干扩张。

然而,这种较大芯片的制造一样荒谬腾贵,这是因为芯片尺寸越大、其弱势率就越高。于是乎,使用数目更多但尺寸较小的芯片也成了有招引力的标的,这也解释了AMD为什么会在假想当中使用这样多的芯粒——在最新的Epyc型号中,芯片数目仍是高达17个。

聊完了以上配景常识,接下来咱们就将深远探讨英特尔和AMD辞别在其最新至强和Epyc处理器中接管的不同假想理念。

AMD的迂腐路

咱们先从AMD的第五代Epyc Turin处理器提及。具体来看,咱们热心的是该芯片的128核Zen 5版块,其领有16个4纳米中枢复合芯片(CCD),同期辅以基于台积电6纳米制程工艺制造的单块I/O芯片(IOD)。

AMD最新一代Epyc配备多达16个狡计芯片

可能许多一又友以为这个数字听起来耳熟,这是因为AMD在其第二代Epyc处理器上使用了基本研究的假想决策。看成比照,第一代Epyc就莫得单独的I/O芯片。

正如前文仍是提到,使用宽广较小的狡计芯片,意味着AMD简略取得更高的产量,同期也能保证在Ryzen和Epyc处理器之间收场芯片分享。

这些芯粒看着是不是似曾康健,

那是因为AMD的Epyc和Ryzen处理器履行上使用着研究的狡计芯片。

此外,在秉承8核或16核CCD且各自对应32 MB L3缓存的情况下,AMD还简略以更大的天真性按缓存及内存等比例扩张中枢数目。

例如来说,要是咱们需要一块领有16个中枢的Epyc(受到软件许可条件的摒弃,这亦然高性能狡计职责负载范围最常见的SKU竖立),那么达成主义的最好形貌天然即是使用两个八中枢CCD,且二者分享64 MB的L3缓存。天然,咱们也不错使用16个CCD,每CCD对应一个步履中枢,同期内置512 MB缓存。天然听起来很纵脱,但这两种假想决策其实都存在。

AMD的第五代Epyc处理器奉命传统模式,将16个狡计中枢围绕单一中央I/O芯片移交而成。

另一方面,I/O芯片则负责除狡计除外的真实整个惩处任务,包括内存、安全性、PCIe、CXL以过火他I/O(例如SATA),同期承载芯片CCD与其他插槽之间的主干通讯。

AMD Epyc Turin I/O芯片细节默示图。

将内存限度器搁置在I/O芯片之上既有优点、也有短板。从好的方面来看,这意味着内存带宽大大多数情况下简略颓唐于中枢数目进行扩张。但过错是某些职责负载的内存暖热存探听延长可能会更高。这里之是以强调“可能更高”,是因为具体情况赓续要视具体职责负载而定。

至强的芯粒探索之旅

话题来到英特尔这边,这家芯片制造商关于多芯片处理器的假想处理跟AMD有着很大不同。天然当代至强处理器也秉承狡计与I/O芯片互相颓唐的异构架构,但只在特定型号上才会出现。

英特尔的第一款多芯片至强处理器代号为Sapphire Rapids,秉承一块单体中等中枢数目的芯片或者四块极点追求高中枢数目的芯片,每块芯片都领有我方的内存限度器与内置I/O功能。Emerald Rapids天然也秉承了访佛的假想模式,但在中枢数目更高的SKU上使用了两块尺寸更大的芯片。

如图所示,在Sapphire和Emerald Rapids之间,英特尔将四块中等尺寸的芯片换成了两对真实以网状排布的更大芯片。

而整个这一切都跟着至强6的变相而有所调换,这一次英特尔将I/O、UPI通顺乃至加快器革新到了两块基于Intel 7制程工艺制造的芯片之上,而中央位置部署的则是秉承Intel 3制程工艺的一到三块狡计芯片。

出于咱们稍后会具体参谋的原因,这里先热心被英特尔奉求厚望的Granite Rapids至强6处理器,姑且将多中枢Sierra Forest放到一边。

不雅察英特尔的狡计芯片,咱们就会发现它与AMD的一大主要区别,就在于每个狡计模块至少有43个内置中枢,且不错字据SKU进行开启和关闭。也即是说在一样收场128个中枢的情况下,英特尔需要的芯片数目要比AMD少得多;但由于前者单块芯片的尺寸更大,因此制造良品率细目也会相应镌汰。

字据不同SKU竖立,Granite Rapids会在两块I/O芯片之间搁置一到三块狡计芯片。

除了更多的中枢除外,英特尔还接管将这些芯片的内存限度器搁置在狡计芯片本色之上,每芯片复旧四条通说念。这种假想表面上应该简略镌汰探听延长,但同期也意味着要是但愿取得一都12条内存通说念,则必须接管领有三块狡计芯片的版块。

至于之前报说念过的6900P系列系统,人人倒无谓系念这个问题,因为其整个SKU都竖立三块板载狡计芯片。但由此也不错看出,其72核版块只使用到了封装中的一小部分芯片。一样的,咱们之前参谋过的面向高性能狡计中心的16核Epyc亦然如斯。

另一方面,英特尔的6700P系列系统将于来岁年头推出,打算配备一到两块狡计芯片,具体取决于客户需要的内存带宽和中枢数目。也即是说内存将被摒弃为最高8条通说念,而配备单块板载狡计芯片霎只可只须4条通说念。咱们现时还不太泄露HCC和LCC芯片上的内存竖立,不抹杀英特尔可能增强了这些部件之上的内存限度器。

与AMD的Epyc一样,英特尔的至强处理器当今秉承同期带有狡计和I/O芯片的异构假想架构

英特尔的I/O芯片假想则相当漂浮,主要承载PCIe、CXL和UPI链路组合,用于同存储、外设过火他插槽进行通讯。除此除外,咱们还发现了宽广用于平直流(DSA)、内存分析(IAA)、加密/解密(QAT)以及负载平衡的加快器。

据了解,英特尔之是以接管在I/O芯片之上搁置加快器,部分原因是想将其搁置在更相连数据的位置,保证数据简略高效流入/流出芯片。

接下来的发展将向哪里去?

从名义上看,英特尔的下一代多核处理器代号为Clearwater Forest,将于来岁上半年推出。其外形与Granite Rapids访佛,领有两块I/O芯片和三个狡计模块。

整款居品看起来就如同削弱版的Granite Rapids,但这响应的昭着只是芯片结构,底层还守密着更多芯粒。

然而,目击有时也或然为实。据咱们了解,这三块狡计芯片履行上只是芯片结构,其下还守密着更多较小的狡计芯片,这些芯粒被移交在有源芯片中介层之上。

从英特尔本年早些时候放出的展示完了图来看,Clearwater Forest的每封装最多不错容纳12个狡计芯片。使用芯片中介层也仍是不簇新,这能带来诸多自制,包括相较通例基板提供更高的芯片间带宽和更低延长等。有些一又友可能仍是看出,这种假想与英特尔此前中枢数目最高的Sierra Forest 144核狡计芯片可谓是大相径庭。

从英特尔本年晚些时候发布的渲染图来看,Clearwater Forest中的守密芯粒可能要比Granite Rapids多得多。

天然,咱们从渲染图中只可看到Clearwater Forest关系本领的一点脉络,并不代表其来岁果真就会与纷乱用户碰面。

况且更大的问题可能在于,AMD下一步究竟会把其芯粒架构带向何方。不雅察AMD的128核Turin处理器,就会发现封装之内仍是莫得太多空间不错容纳更多芯片;只须Zen处理器家眷还有一定腾挪的余步。

率先,AMD不错接管更大的封装,为荒谬的芯粒腾出空间。或者,这家芯片制造商也不错将更多中枢封装进宽广芯粒之内。然而,咱们忖度AMD的第六代Epyc,最终看起来可能会更访佛于其Insinct MI300系列加快器。

MI300A将24个Zen 4中枢、6个CDNA 3 GPU芯片以及128 GB HBM3内存集成到了并吞面向高性能狡计职责负载的封装之内。

人人可能还铭刻,当初与MI300 X GPU一同推出的还有一款APU,它将芯片中的两个CDNA3模块换成了三个CCD,对应24个Zen 4狡计中枢。其这些狡计模块堆叠在四个I/O芯片之上,再联结到八个HBM3模块组当中。

天然现时还只是忖度,但AMD后续秉承访佛的假想也整个在理由之中,例如用荒谬的CCD替换掉一都内存和GPU芯片。这样的假想细目简略带来更高的传输带宽和更低的芯片间通讯延长。

履行谜底是否正确,只须留给时间去徐徐施展。咱们瞻望AMD的第六代Epyc处理器将于2026年底细致投放阛阓。