美國(guó)硅谷創(chuàng)企 Cerebras Systems 推出了其新的 Wafer Scale Engine 2(WSE-2)處理器,該處理器為超級(jí)計(jì)算任務(wù)而構(gòu)建,具有破紀(jì)錄的 2.6 萬(wàn)億個(gè)晶體管(市場(chǎng)上最大的 GPU 只有 540 億個(gè)晶體管)和 85 萬(wàn)顆 AI 優(yōu)化內(nèi)核,大小類似餐盤,采用臺(tái)積電的 7nm 工藝。
這是 Cerebras 第二次使用整個(gè) 300mm 晶圓制造單顆芯片。這么大的晶圓一般會(huì)被切割成數(shù)百個(gè)獨(dú)立芯片,Cerebras 卻將其制成一個(gè)芯片。在龐大的體積之下,這種芯片相比同等算力的 GPU 集群,功耗和所占空間更小。
一、Cerebras 估值約 24 億美元,創(chuàng)始人斯坦福出身
Cerebras Systems 位于美國(guó)加利福尼亞州,創(chuàng)建于 2016 年。該公司專注于深度學(xué)習(xí)的計(jì)算機(jī)系統(tǒng)。目前該公司在硅谷、多倫多和東京都有辦事處,2019 年 11 月獲得了 4.75 億美元的 E 輪融。融資后,Cerebras Systems 估值約為 24 億美元。
安德魯?費(fèi)爾德曼(Andrew Feldman)是 Cerebras 的聯(lián)合創(chuàng)始人兼首席執(zhí)行官,他具有斯坦福大學(xué)學(xué)士學(xué)位和工商管理碩士學(xué)位,曾經(jīng)創(chuàng)辦了專注于超高密度計(jì)算機(jī)服務(wù)器業(yè)務(wù)的 Seammicro 公司。Seammicro 在 2012 年被 AMD 以 3.57 億美元價(jià)格收購(gòu)。
2019 年,Cerebras 曾發(fā)布第一代 WSE 芯片,這款芯片具有 40 萬(wàn)個(gè)內(nèi)核和 1.2 萬(wàn)億個(gè)晶體管,使用臺(tái)積電 16nm 工藝制程。
二、WSE-2 性能參數(shù)超競(jìng)品幾個(gè)數(shù)量級(jí),良率更高
WSE-2 仍由臺(tái)積電代工,但采用更加先進(jìn)的 7nm 工藝。與第一代芯片相比,WSE-2 的晶體管數(shù)、內(nèi)核數(shù)、內(nèi)存、內(nèi)存帶寬和結(jié)構(gòu)帶寬等性能特征增加了一倍以上。由于 WSE-2 采用了 7nm 工藝制程,電路之間的寬度僅有七十億分之一米。
如此龐大的芯片尺寸帶來(lái)了 WSE-2 的大幅性能提升,該芯片的各類性能參數(shù)超出競(jìng)品幾個(gè)數(shù)量級(jí),能夠極大地縮減 AI 訓(xùn)練時(shí)間。
相比競(jìng)品 GPU,WSE-2 芯片的內(nèi)核數(shù)量是其 123 倍,芯片內(nèi)存是競(jìng)品的 1000 倍以上,內(nèi)存帶寬是 12000 倍,結(jié)構(gòu)帶寬也增加了 45000 倍。
Feldman 指出,通過將芯片放大互連,就可以在芯片上保留大量數(shù)據(jù)。WSE-2 相對(duì)普通 GPU 集群,延遲和能耗都會(huì)比較低。普通 GPU 集群在提供相同的算力時(shí),將會(huì)需要數(shù)十個(gè)機(jī)架,花費(fèi)數(shù)個(gè)月進(jìn)行配置和編程,功率將高達(dá)數(shù)百瓦。
WSE-2 相對(duì) GPU 還有很多核心冗余,如果有內(nèi)核發(fā)生故障,單獨(dú)的故障內(nèi)核并不影響芯片使用。而在臺(tái)積電這樣的晶圓代工廠中,很少出現(xiàn)連續(xù)的內(nèi)核缺陷,因此 WSE-2 的良率較高。
三、Cerebras 擁有多位重量級(jí)客戶
國(guó)際調(diào)研機(jī)構(gòu) Moor Insights&Strategy 的分析師 Patrick Moorhead 認(rèn)為,WSE-2 內(nèi)核數(shù)量帶來(lái)的性能確實(shí)對(duì)英偉達(dá)的 GPU 產(chǎn)生了一定挑戰(zhàn)。但是英偉達(dá)的解決方案更加靈活,幾乎可以安裝在任何服務(wù)器機(jī)箱中。
Tirias Research 首席分析師 Jim McGregor 在一封電子郵件中寫道,雖然對(duì)于數(shù)以百萬(wàn)的 AI 算法來(lái)說,Cerebras 不像英偉達(dá)一樣全面,但是 Cerebras 的解決方案顯然已經(jīng)吸引到了許多客戶。
從 2019 年交付 WSE 芯片起,在過去的一年里,已經(jīng)有很多重量級(jí)用戶使用了 Cerebras 的產(chǎn)品。
比如美國(guó)阿貢國(guó)家實(shí)驗(yàn)室、勞倫斯利弗莫爾國(guó)家實(shí)驗(yàn)室、匹茲堡超級(jí)計(jì)算中心、愛丁堡大學(xué)的超級(jí)計(jì)算中心、葛蘭素史克、東京電子器件等。
全球制藥巨頭葛蘭素史克的高級(jí)副總裁 Kim Branson 稱贊到,Cerebras 增加了編碼器模型的復(fù)雜性,將訓(xùn)練時(shí)間減少到之前的 1/80。
在美國(guó)最大的科學(xué)與工程研究室阿貢國(guó)家實(shí)驗(yàn)室,CS-1 芯片被用于癌癥研究,將癌癥模型的實(shí)驗(yàn)周轉(zhuǎn)時(shí)間減少到 1/300 還少。
Feldman 說,Cerebras 將在明年公布產(chǎn)品在重型制造、制藥、生物技術(shù)和軍事等領(lǐng)域取得的成就。WSE-2 將被集成到 CS-2 超算系統(tǒng)中,在今年第三季度上市。
結(jié)語(yǔ):Cerebras 另辟蹊徑展現(xiàn)巨型芯片前景
雖然相比英偉達(dá),Cerebras 沒有那么全面,但是 WSE 系列芯片并非單純的放大。在芯片尺寸如此巨大后,互連技術(shù)、芯片封裝、散熱等問題都會(huì)發(fā)生很大變化。
Cerebras 解決了這些問題,用 WSE-2 的優(yōu)點(diǎn)向我們展示了芯片尺寸并非只能越做越小,巨型芯片也存在廣泛的應(yīng)用前景。