Hot Chips 2010大會(huì )上,IBM開(kāi)始討論起z196處理器,這款產(chǎn)品最早在7月29日發(fā)布,出貨日期在9月份,IBM并沒(méi)有太多地談及作為系統核心的新四核處理器的技術(shù)和性能等信息,只是表示新型主機的處理器主頻為5.2GHz, 是“全球最快的微處理器”。確實(shí)是這樣的——如果你單看原始主頻的話(huà)。但是,除了高主頻之外,還有更多關(guān)于z196處理器的信息。
四核z196處理器與4.4GHz的四核z10處理器有某些相似之處。z196處理器采用了45nm制程工藝(z10芯片采用的是65nm),這 意味著(zhù)IBM可以將所有東西都集成到這個(gè)芯片上,事實(shí)上IBM確實(shí)是這么做的,就像它在今年二月公布8核POWER7時(shí)所表示的那樣。

據了解,Z196處理器有14億個(gè)晶體管,面積為512.3平方毫米,這使其在晶體管數量和面積上都要大于POWER7芯片。z196芯片采用 了IBM的觸點(diǎn)陳列封裝,被稱(chēng)為C4的金屬觸點(diǎn)封裝取代了以往的針狀插腳——其觸點(diǎn)數量驚人:8093個(gè)電源觸點(diǎn)和1134個(gè)信號觸點(diǎn)。
z196芯片每個(gè)核心都有64KB的L1指令緩存和128KB的L1數據緩存,這一點(diǎn)和Z10非常相似。但是z196有100個(gè)新指令和超 標量通道允許指令重新排序,這樣Z196通道就比z10的更有效,而且其編輯代碼是不可見(jiàn)的。除此之外,Z196的每個(gè)核心都有1.5MB的L2緩存。
z196引擎的超標量通道可以在每個(gè)時(shí)鐘周期內解碼3個(gè)z/Architecture CISC指令并執行多達5個(gè)操作。每個(gè)核心有6個(gè)執行單元:2個(gè)整數單元,1個(gè)浮點(diǎn)單元,2個(gè)加載/保存單元和1個(gè)小數單元。IBM表示,這浮點(diǎn)單元要比 z10芯片中的更好,但是沒(méi)有透露它在每個(gè)時(shí)鐘周期內可以做多少flops。之前的一些z/Architecture CISC指令已經(jīng)被分割成塊,使其能夠更有效地分散在通道中,讓z196更像是RISC。
與POWER7芯片一樣,z196在芯片中采用嵌入式的DRAM(eDRAM)作為L(cháng)3緩存。這種eDRAM比經(jīng)常用作緩存的靜態(tài)DRAM(SRAM)速度更慢,你可以將其指定到一個(gè)特定的區域。對很多工作負載來(lái)說(shuō),讓更多內存接近于芯片要比使用高速內存更加重要。z196處理器有 24 MB的eDRAM L3緩存,被劃分為2個(gè)存儲體,并由2個(gè)片上L3緩存控制器進(jìn)行管理。
每個(gè)z196芯片可以作為一個(gè)GX I/O總線(xiàn)控制器——這種方法同樣被用于POWER系列芯片中,用于連接主機通道適配器和其他外圍設備,每個(gè)插槽分配得到一個(gè)與受RAID保護的DDR3 主內存相連接的內存控制器。此外,z196芯片還有2個(gè)加密和壓縮處理器,IBM大型機采用了這種第三代電路設計。
z196芯片采用兩個(gè)核心共享其中一個(gè)協(xié)同處理器方式,且每個(gè)核心有16KB的緩存空間。最終達到每個(gè)z196芯片有一個(gè)可連接SMP Hub/共享緩存芯片接口。如下圖所示,有2個(gè)芯片被集成到一個(gè)z196多芯片模塊(MCM)上,提供了交叉耦合允許MCM上所有6個(gè)插槽通過(guò)40GB /s相連接。Z196提供的是交叉耦合訪(fǎng)問(wèn)方式,在MCM上提供了六個(gè)插槽以40GB/s的速度連接到各芯片上,zEnterprise 196 SMP Hub/共享緩存。
在IBM大型機中,z196處理引擎相當于中央處理器(CP),而CP的互連芯片稱(chēng)為共享緩存(SC)。每個(gè)SC有6個(gè)CP接口相互連接,其中有3個(gè)架構接口連接到全加載的z196系統中其他3個(gè)MCM。

從上面的架構圖來(lái)看,SMP Hub的一個(gè)優(yōu)點(diǎn)就是可以加載到帶有L4緩存的組件上,這是大多數服務(wù)器所沒(méi)有的——幾年前IBM曾向至強處理器的EXA芯片組上增加了一些L4緩存(即采用了eX4架構的IBM X3850M2/3950M2平臺,可通過(guò)擴展組建升級為16路系統。對應的CPU為Xeon 7400系列)。L4緩存之所以重要,其原因在于大型機引擎的主頻要遠高于主內存速度,但是如果只通過(guò)增加一個(gè)緩存層來(lái)滿(mǎn)足Z196的引擎需求是非常昂貴 的。不管怎樣,這種SMP Hub/共享緩存芯片和CP一樣也是采用45nm制程工藝,有15億個(gè)晶體管,面積為478.8平方毫米,封裝中有8919個(gè)觸點(diǎn)。
每個(gè)MCM上部署6個(gè)CP和2個(gè)SC,MCM是一個(gè)邊長(cháng)96毫米的正方形,功耗1880瓦。每個(gè)處理器板有一個(gè)MCM,這使得一個(gè)完全連接的系 統可以達到96個(gè)CP,十幾個(gè)控制器可以訪(fǎng)問(wèn)多達3TB RAID內存,32個(gè)I/O Hub接口最高可實(shí)現288 GB/s的I/O帶寬。頂架式zEnterprise 196 M80設備中的80個(gè)CP可用于運行工作負載,其他可以使用Parallel Sysplex集群來(lái)耦合系統、管理I/O和熱備份等等。 |