關(guān)鍵字:ARM服務(wù)器 芯片設計 挑戰英特爾 科學(xué)實(shí)驗模塊
這家名為飛騰信息技術(shù)有限公司的年輕廠(chǎng)商誕生于2012年,其宣稱(chēng)自家處理器采用64個(gè)自定義ARMv8計算核心,采用28納米制程并擁有最高2 GHz主頻。由于每運算周期可處理高達四條指令,這意味著(zhù)其最大運算能力將達到每秒5120億次浮點(diǎn)運算。
這款代號為“火星”的設計方案超越了當前各類(lèi)高端ARM服務(wù)器芯片,包括目前正處于樣品展示階段的Cavium 48核心ThunderX處理器以及另一款仍處于開(kāi)發(fā)當中的博通方案。今年2月,EZchip公司曾表示其將發(fā)布一款采用28納米制程的100核心ARMv8處理器,但其正式推出時(shí)間定為2017年。
這款“火星”處理器的設計方案尚未公開(kāi),但齊聚一堂的分析師以及微處理器設計師們已經(jīng)開(kāi)始將注意力轉移到其身上,—部分原因是飛騰公司在此前可以說(shuō)是寂寂無(wú)名。
Insight64公司(位于加利福尼亞州薩拉托加)負責人Nathan Brookwood贊嘆道,“這是目前為止公布的最震撼人心的64位ARM芯片,性能非常強勁,而且絕對是本次大會(huì )上最大的驚喜。”
AMD公司研究員兼會(huì )議主持者Sam Naffziger則將“火星”形容為一套“擁有出色緩存層級與良好帶寬匹配”的上佳設計方案。
Hot Chips大會(huì )的組織者們亦對飛騰公司發(fā)來(lái)的論文感到驚訝,畢竟這是一家他們聞所未聞的年輕企業(yè)。在此之前,Hot Cips大會(huì )還曾經(jīng)收到過(guò)幾篇由中國政府及高校組建的龍芯處理器構建團隊發(fā)來(lái)的論文。
Hot Chips大會(huì )的組織者之一Ralph Wittig表示,“我很驚訝今年龍芯團隊沒(méi)有拿出什么新的成果,但我們從飛騰方面收到了相關(guān)論文,并聽(tīng)說(shuō)他們這家初創(chuàng )企業(yè)有信心在A(yíng)RM領(lǐng)域大展身手,他們的外部?jì)却婺K跟IBM的Power 8設計方案比較相似,作為項目委員會(huì ),飛騰的成果給我們留下了深刻印象。”
更具神秘色彩的是,飛騰公司的一位工程經(jīng)理沒(méi)能在大會(huì )期間順利拿到赴美簽證。為了解決問(wèn)題,他決定在位于天津及廣州的公司辦公室里通過(guò)手機展示幻燈片內容。
一位熟悉飛騰公司的與會(huì )者表示,該團隊并非脫胎于龍芯項目組。該公司的天津分部還由于此前發(fā)生的重大爆炸事故而一片狼藉。
在對SpecCPU 2006基準測試進(jìn)行模擬運行時(shí),“火星”處理器作為64核心芯片分別在整數運算與浮點(diǎn)運算項目中拿到了672分與585分。不過(guò)觀(guān)察人士指出,這一成績(jì)換算至單一核心性能就顯得有些疲軟了。
這款芯片被整體劃分為多個(gè)八核心層,其中每四個(gè)計算核心共享4 MB緩存容量。八塊外部芯片總計提供129 MB三級緩存及16條DDR3-1600通道。
飛騰的自定義64位ARM計算核心擁有192個(gè)物理寄存器。其重排序緩沖器能夠容納最高160條指令,而整體通道中的指令容納數量則在210條左右。
這款芯片按順序分發(fā)并清理指令,并以無(wú)序方式進(jìn)行指令執行。其采用一套主動(dòng)式分支預測機制并擁有多線(xiàn)程能力。
“火星”支持MPI與Open MP接口以實(shí)現多處理系統。另一款尚處于開(kāi)發(fā)階段的處理器代號為“地球”,其將擁有業(yè)界最低之成本與功耗水平,且主要面向目前的各類(lèi)大型數據中心。
“我敢肯定,火星將成為世界上第一款64核心的ARMv8處理器,”飛騰公司研究員Charles Zhang通過(guò)電話(huà)向Hot Chips大會(huì )的各位與會(huì )者們宣稱(chēng)。“這是個(gè)很好的開(kāi)端……在接下來(lái)的幾年中,我們將開(kāi)發(fā)出更為強大的CPU方案。”
火星處理器的最大弊端之一在于其龐大的體積,分析師們指出。想利用這樣巨大的芯片實(shí)現運營(yíng)收益實(shí)在不是易事。
甲骨文發(fā)布首款集成Infiniband芯片服務(wù)器
甲骨文公司在本屆Hot Chips大會(huì )上公布了一款新的服務(wù)器處理器,這是其首款集成了Infiniband的芯片產(chǎn)品。這款代號為Sonoma的芯片是新家族中的首位成員,同時(shí)能夠為甲骨文數據庫及其它軟件方案提供加速功能。
Sonoma是一款采用20納米制程工藝的芯片,其中包含八個(gè)M7級Sparc計算核心,每核心最高可支持八線(xiàn)程。它封裝有兩個(gè)DDR4內存控制器,單插槽內存容量上限為1 TB,且峰值內存傳輸帶寬為每秒77 GB。
這款芯片還包含一個(gè)PCI Express Gen 3控制器,外加四條用于多處理器協(xié)同工作的每秒16 Gb傳輸鏈路。
集成Inifniband占用了這款芯片占五分之一的表面積。其采用兩連56G Infiniband鏈路且支持虛擬化功能,擁有32個(gè)虛擬獨立Infiniband適配器。
甲骨文公司將Infiniband內置于芯片當中,從而最大程度優(yōu)化其使用效果并保障自有知識產(chǎn)權,一位設計團隊成員解釋稱(chēng)。這款芯片還擁有其它幾種潛在用途,甲骨文方面能夠借此利用Infiniband讓一系列現有系統實(shí)現集群化、存儲以及其它應用能力。
Sonoma芯片當中包含四個(gè)數據庫加速塊,且針對甲骨文軟件產(chǎn)品作出了優(yōu)化。該芯片還提供一個(gè)小型元數據塊,可作為緩沖區以避免內存溢出并防止HeartBleed等惡意攻擊的出現。
“這是一款令人印象深刻的芯片,而且也為芯片集成Infiniband吹響了前進(jìn)的號角,”分析師Brookwood表示,“甲骨文公司已經(jīng)在利用Infiniband訪(fǎng)問(wèn)存儲資源方面表現出了遠超其它同業(yè)企業(yè)的積極態(tài)度,相比之下各競爭對手仍在利用獨立芯片實(shí)現Infiniband功能。”