2016年才成立的斯洛伐克創(chuàng)業(yè)公司Tachyum今天拋出一枚重磅炸彈,宣布了全新的128核心Prodigy處理器,號(hào)稱(chēng)“性能可超越Intel最快的至強(qiáng),同時(shí)功耗僅有十分之一”。
首先說(shuō)一下Tachyum的背景:這家公司設(shè)立在斯洛伐克,并得到過(guò)斯洛伐克政府1700萬(wàn)美元投資,但幾位創(chuàng)始人都是美國(guó)人,且大有來(lái)頭。
尤其是CEO Radoslav Danilak,擁有25年的半導(dǎo)體行業(yè)經(jīng)驗(yàn),一度大紅大紫的SSD主控巨頭SandForce就是他創(chuàng)立的,還親自擔(dān)任CEO,后被希捷收購(gòu),后來(lái)又創(chuàng)立了Skyera,繼續(xù)研究SSD主控技術(shù),2014年又被西數(shù)收購(gòu)。
Tachyum Prodigy號(hào)稱(chēng)是全球第一顆“通用處理器”(universal processor),因?yàn)樗趩为?dú)一顆硅片內(nèi),集成了通用目的處理器、高性能計(jì)算、AI人工智能、DML深度機(jī)械學(xué)習(xí)、可解釋人工智能(Explainable AI)、生物人工智能(Bio AI)等等,基于并行多處理器環(huán)境,可簡(jiǎn)化編程模型和環(huán)境。
最新的頂級(jí)型號(hào)為Prodigy T6128,單路單芯片集成128個(gè)物理核心,亂序執(zhí)行架構(gòu),每時(shí)鐘周期4條指令,支持64位尋址、512位矢量操作、AI/ML矢量和矩陣乘法加速、虛擬化、高級(jí)RAS,運(yùn)行頻率最高4GHz。
緩存方面,每個(gè)核心32KB一級(jí)指令緩存、32KB一級(jí)數(shù)據(jù)緩存,均支持ECC,末級(jí)緩存共享64MB,支持DECTED ECC。
內(nèi)存方面,支持12個(gè)通道的DDR4、DDR5,最高頻率DDR5-4800,但每通道只能有一條內(nèi)存條,單條最大容量512GB,合計(jì)最大6TB,并支持高級(jí)糾錯(cuò)和RAS。
IO方面,集成了多達(dá)36個(gè)PCIe 5.0控制器,最多48條通道,同時(shí)還集成了兩組400G(40萬(wàn)兆)以太網(wǎng)控制器。
更驚人的是,所有這些強(qiáng)大的規(guī)格,在臺(tái)積電7nm工藝的加持下,封裝面積才不過(guò)85×85平方毫米,略大于Intel LGA2066的酷睿,但小于AMD SP3的線程撕裂者。
Tachyum沒(méi)有披露Prodigy的具體架構(gòu),不知道基于RISC-V、MIPS、ARM還是自研,只是說(shuō)無(wú)論單線程還是多線程應(yīng)用,都已經(jīng)超越了Intel至強(qiáng),但是又比ARM更小巧。
據(jù)介紹,Prodigy T6128處理器適合大規(guī)模超級(jí)計(jì)算機(jī)、大數(shù)據(jù)、大型AI應(yīng)用,可提供262TFlops AI訓(xùn)練和推理性能、16TFlops HPC高性能計(jì)算性能。
開(kāi)發(fā)環(huán)境方面,Tachyum也提供了一系列工具,包括FPGA模擬器、軟件模擬器、二進(jìn)制翻譯器、C/C++/Fortran編譯器、調(diào)試器和配置文件、TensorFlow編譯器,都在Linux操作系統(tǒng)下。
如果客戶(hù)不需要128核心這么高大上的規(guī)格,Tachyum也提供64/32/24/16核心等不同配置。
64核心的有兩款型號(hào),一個(gè)是T864,支持八通道DDR4/DDR5內(nèi)存、72條PCIe 5.0通道、兩組400G以太網(wǎng)、兩組HBM3(可選)、32MB完全一致性二級(jí)/三級(jí)緩存,運(yùn)行頻率4GHz,核心電壓0.8V,熱設(shè)計(jì)功耗180W,核心面積290平方毫米,封裝面積66×66平方毫米,可以取代單路/雙路的至強(qiáng)E7、至強(qiáng)E5。
另一個(gè)是TH24,專(zhuān)供AI/HPC,四通道DDR5和/或32GB HBM3,后者可作為緩存也可以是獨(dú)立內(nèi)存,需要高精密水冷。
32核心的型號(hào)為T(mén)432,四通道DDR4,32條PCIe 4.0,兩組100G以太網(wǎng)。16核心的則是T216,雙通道DDR4,32條PCIe 4.0,兩組50G以太網(wǎng)。二者都是小尺寸封裝,成本和價(jià)格低廉,適合取代至強(qiáng)E5、至強(qiáng)E3、至強(qiáng)D系列。
當(dāng)然,這些產(chǎn)品大部分都還在紙面上,目前只流片成功了64核心的T864,預(yù)計(jì)今年內(nèi)投入量產(chǎn)。
關(guān)鍵詞: