(CWW)2021年11月9日,AMD宣布推出全新AMD Instinct MI200系列加速器,作為首款Exascale級(jí)(百億億次級(jí)) GPU加速器,AMD Instinct MI200系列加速器包括世界領(lǐng)先的高性能計(jì)算(HPC)和人工智能(AI)加速器 - AMD Instinct MI250X。
AMD Instinct MI200系列加速器基于AMD CDNA 2架構(gòu),可為廣泛的HPC工作負(fù)載提供領(lǐng)先的應(yīng)用程序性能。 其中,AMD Instinct MI250X加速器可為雙精度(FP64)高性能應(yīng)用程序提供更強(qiáng)的性能,并為AI工作負(fù)載帶來(lái)超過(guò)380 teraflops的理論半精度(FP16)峰值,通過(guò)強(qiáng)大的性能進(jìn)一步加速由數(shù)據(jù)驅(qū)動(dòng)的研究。
AMD高級(jí)副總裁兼數(shù)據(jù)中心與嵌入式解決方案事業(yè)部總經(jīng)理Forrest Norrod表示:“AMD Instinct MI200加速器提供了領(lǐng)先的HPC和AI性能,幫助科學(xué)家在研究方面實(shí)現(xiàn)了跨時(shí)代的飛躍,同時(shí)極大地縮短了從最初的假設(shè)到發(fā)現(xiàn)的時(shí)間。憑借在架構(gòu)、封裝和系統(tǒng)設(shè)計(jì)方面的關(guān)鍵性創(chuàng)新,AMD Instinct MI200系列加速器是公司有史以來(lái)更為先進(jìn)的數(shù)據(jù)中心GPU,為超級(jí)計(jì)算機(jī)和數(shù)據(jù)中心帶來(lái)卓越的性能,以幫助超級(jí)計(jì)算機(jī)和數(shù)據(jù)中心解決世界上的復(fù)雜難題。”
AMD加速Exascale時(shí)代
AMD與美國(guó)能源部、橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室和HPE合作共同設(shè)計(jì)的Frontier超級(jí)計(jì)算機(jī),預(yù)計(jì)可提供超過(guò)1.5 exaflops的峰值計(jì)算性能?;诘谌鶤MD EPYC處理器以及AMD Instinct MI250X加速器,F(xiàn)rontier將通過(guò)大幅提高AI、分析和模擬的性能來(lái)推動(dòng)科學(xué)發(fā)現(xiàn)的發(fā)展,幫助科學(xué)家進(jìn)行更多計(jì)算、識(shí)別數(shù)據(jù)中的新模式,并開(kāi)創(chuàng)新的數(shù)據(jù)分析方法,從而加速科學(xué)發(fā)現(xiàn)的速度。
橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室主管Thomas Zacharia說(shuō):“Frontier超級(jí)計(jì)算機(jī)是AMD、HPE和美國(guó)能源部之間強(qiáng)有力合作的結(jié)晶,它提供了一個(gè)具有Exascale能力的系統(tǒng),通過(guò)大幅提高人工智能、分析和模擬的性能,推動(dòng)科學(xué)發(fā)現(xiàn)的發(fā)展?!?/p>
為HPC的未來(lái)提供動(dòng)力
AMD Instinct MI200系列加速器與第三代AMD EPYC處理器和ROCm 5.0開(kāi)放軟件平臺(tái)相結(jié)合,旨在推動(dòng)Exascale時(shí)代新發(fā)現(xiàn),并解決從氣候變化到疫苗研究等種種最緊迫的新挑戰(zhàn)。
AMD Instinct MI200系列加速器關(guān)鍵特性和功能包括:
·AMD CDNA 2架構(gòu)- 相比AMD前代GPU,第二代矩陣核心加速的FP64和FP32矩陣運(yùn)算可提供高達(dá)4倍的FP64理論峰值性能
·領(lǐng)先的封裝技術(shù) - 作為業(yè)界首個(gè)采用2.5D Elevated Fanout Bridge技術(shù)(EFB)的多芯片GPU設(shè)計(jì),與AMD前代GPU相比,可提供1.8倍的核心數(shù)和2.7倍的顯存帶寬,以及業(yè)界領(lǐng)先的每秒3.2 terabytes的理論峰值顯存帶寬。
·第三代AMD Infinity Fabric技術(shù) - 多達(dá)8個(gè)Infinity Fabric鏈接將AMD Instinct MI200與節(jié)點(diǎn)中的第三代EPYC處理器和其他GPU相連,以實(shí)現(xiàn)統(tǒng)一的CPU內(nèi)存/GPU顯存一致性和系統(tǒng)吞吐量最大化,通過(guò)加速器的強(qiáng)大性能使CPU代碼更簡(jiǎn)化。
專為Exascale科學(xué)而打造的軟件
AMD ROCm是一個(gè)開(kāi)放的軟件平臺(tái),可幫助研究人員借助AMD Instinct加速器的強(qiáng)大性能推動(dòng)科學(xué)發(fā)現(xiàn)。ROCm平臺(tái)建立在開(kāi)放移植的基礎(chǔ)上,支持跨多個(gè)加速器供應(yīng)商和架構(gòu)的環(huán)境。得益于ROCm 5.0,AMD擴(kuò)展了其開(kāi)放平臺(tái):通過(guò)AMD Instinct MI200系列加速器為頂級(jí)HPC和AI應(yīng)用程序提供支持,為開(kāi)發(fā)者增加了ROCm的可訪問(wèn)性,并在關(guān)鍵工作負(fù)載中提供領(lǐng)先的性能。
借助AMD Infinity Hub,研究人員、數(shù)據(jù)科學(xué)家和終端用戶可以輕松地找到、下載并安裝在AMD Instinct加速器和ROCm上得到充分優(yōu)化和支持的眾多HPC應(yīng)用程序和ML框架。該項(xiàng)目門戶目前可支持AMD Radeon Instinct MI50、AMD Instinct MI100以及AMD Instinct MI200加速器,包括Chroma、CP2k、LAMMPS、NAMD、OpenMM在內(nèi)的等眾多應(yīng)用程序,以及TensorFlow和PyTorch這樣的ML框架。目前該項(xiàng)目門戶中的可支持列表還在不斷增加。
現(xiàn)有服務(wù)器解決方案
AMD Instinct MI250X和AMD Instinct MI250現(xiàn)已可在開(kāi)放硬件計(jì)算加速器模塊或OCP加速器模塊(OAM)規(guī)范中使用。AMD Instinct MI210將在OEM服務(wù)器中的PCIe卡規(guī)范中使用。
目前AMD MI250X加速器已開(kāi)始為HPE的HPE Cray EX超級(jí)計(jì)算機(jī)提供動(dòng)力,預(yù)計(jì)2022年第一季度,包括華碩、ATOS、戴爾科技、Hewlett Packard Enterprise(HPE)、聯(lián)想和Penguin Computing and Supermicro等在內(nèi)的企業(yè)級(jí)市場(chǎng)主要OEM和ODM合作伙伴,將在其系統(tǒng)中使用其它AMD Instinct MI200系列加速器。