AMD推土机架构:核心捆绑技术
创始人
2024-06-13 14:50:19
0

Intel Nehalem架构支持单核心双线程,而AMD推土机架构则颇有点儿反其道而行之的意思,将每两个核心捆绑在一块儿,称之为一个“推土机模块”(Bulldozer Module),让其中着两个核心既有各自独立的执行管线、整数调度器和一级缓存,也有共享的预取和解码单元、浮点调度器(和两个128-bit FMAC乘法累加单元)、二级缓存。

Intel在Core/Nehalem微架构中使用一个统一调度器处理所有指令,不管是整数的还是浮点的,而AMD推土机架构将它们独立开来。AMD表示,每个推土机模块都有一个浮点调度器,辅以两个128-bit FMAC,而分配给核心的每个线程都可以使用任意一个FMAC单元;如果一个线程是纯整数的,另一个就可以将所有浮点执行资源据为己有。

另外AMD相信,常规服务器工作负载量中有80%都是纯整数操作,所以才给每个推土机模块配备了两个整数调度器,每个核心一个。

 

那么在AMD路线图上的新架构四核心处理器指的是四个这样的模块呢,还是四个计算核心呢?

AMD对此给出的回复是:“将每个拥有双整数核心的推土机模块视为一个独立的单元,就对了。”显然,AMD在这里刻意回避了单纯的核心数量问题,更强调两两组成的有机整体,所以在面对推土机架构处理器的时候我们可以说它是四核心、八核心的,也可以说是双模块、四模块的。或许,以后不会再有奇数核心了,因为推土机的每个模块都是整体的,看起来不能单独屏蔽其中一个核心。

 

双模块四核心推土机处理器示意图(所有核心共享三级缓存和北桥)

 

四模块八核心示意图

Intel的超线程技术让处理器核心面积增加了不到5%,可带来最多30%的性能提升,其中浮点7%、整数13%,当然实际应用中差异很大。

AMD推土机模块使用两个整数核心增加的核心面积则有50%左右,但AMD表示这在线程代码上获得的性能提升最多能有80%。当然,不要指望新架构就能带来翻天覆地的变化。根据路线图,“赞比西河”(Zambezi)会有四核心和八核心版本(双模块和四模块),其中四核心的整数性能大约比频率类似的Phenom II X4高出10-35%,八核心的将成为一个线程怪兽。

 

顺便再说说CPU/GPU合二为一的APU。首款产品代号“Llano”,其中CPU部分源于现在的K10 Phenom II,只不过会改用新工艺(32nm),GPU部分则可能来自DX11 Evergreen,当然也是同样的新工艺。

 

Llano核心示意图

当然,APU并不仅仅是简单滴集成GPU,否则也不会用这么久。按照规划,再过三到五年,AMD就会把CPU和GPU的执行单元完全做到一起,其中绝大部分浮点操作都脱离CPU而转入擅长此道的GPU部分,CPU和GPU的概念也会模糊起来。

 

K8架构普及了64位计算和集成内存控制器,K10架构首次引入了共享三级缓存和专用二级缓存,模块化的推土机和融合化的APU能否再次引领新潮流呢?

【编辑推荐】

  1. 推土机架构成基石 AMD披露技术细节
  2. 俄罗斯变态狂人超频AMD至7G 液氮保证制冷
  3. AMD年度财务分析师大会披露平台和技术路线图

相关内容

热门资讯

如何允许远程连接到MySQL数... [[277004]]【51CTO.com快译】默认情况下,MySQL服务器仅侦听来自localhos...
如何利用交换机和端口设置来管理... 在网络管理中,总是有些人让管理员头疼。下面我们就将介绍一下一个网管员利用交换机以及端口设置等来进行D...
施耐德电气数据中心整体解决方案... 近日,全球能效管理专家施耐德电气正式启动大型体验活动“能效中国行——2012卡车巡展”,作为该活动的...
20个非常棒的扁平设计免费资源 Apple设备的平面图标PSD免费平板UI 平板UI套件24平图标Freen平板UI套件PSD径向平...
德国电信门户网站可实时显示全球... 德国电信周三推出一个门户网站,直观地实时提供其安装在全球各地的传感器网络检测到的网络攻击状况。该网站...
为啥国人偏爱 Mybatis,... 关于 SQL 和 ORM 的争论,永远都不会终止,我也一直在思考这个问题。昨天又跟群里的小伙伴进行...
《非诚勿扰》红人闫凤娇被曝厕所... 【51CTO.com 综合消息360安全专家提醒说,“闫凤娇”、“非诚勿扰”已经被黑客盯上成为了“木...
2012年第四季度互联网状况报... [[71653]]  北京时间4月25日消息,据国外媒体报道,全球知名的云平台公司Akamai Te...