百度智能云&英偉達(dá)新一代高性能AI計(jì)算集群線上分享會下周開講

發(fā)布時間:2022-03-14 12:13:29  |  來源:騰訊網(wǎng)  

百度智能云于3月9日對外宣布落地新一代高性能AI計(jì)算集群,可提供EFLOPS級算力支持,并發(fā)布新一代GPU服務(wù)器實(shí)例GPU-H5-8NA100-IB01。同時將在3月16日19點(diǎn)在B站企業(yè)號“百度智能云的朋友們”和“百度智能云”視頻號,以及“智猩猩”視頻號上進(jìn)行同步直播。

領(lǐng)先AI原生云算力底座的技術(shù)實(shí)力全新揭秘

新一代高性能AI計(jì)算集群基于NVIDIA A100-80G NVLink GPU和InfiniBand HDR構(gòu)建,成為領(lǐng)先的AI原生云算力底座。研究人員可基于全新發(fā)布的實(shí)例組建上千節(jié)點(diǎn)規(guī)模的超高性能計(jì)算集群,成倍縮短超大AI模型的訓(xùn)練時間,激發(fā)AI業(yè)務(wù)創(chuàng)新想象力。

并且在新一代GPU服務(wù)器實(shí)例GPU-H5-8NA100-IB01中,采用了百度自研X-MAN架構(gòu)的超級AI計(jì)算機(jī)為硬件平臺。X-MAN自2016年推出以來,已在鳳巢、自動駕駛、自然語言處理等百度內(nèi)部業(yè)務(wù)進(jìn)行大規(guī)模應(yīng)用多年,申請了六項(xiàng)專利,包括PCIe Fabric架構(gòu)、液冷技術(shù)、最大支持64GPU卡擴(kuò)展等,是百度AI業(yè)務(wù)快速落地的重要基礎(chǔ)設(shè)施。目前,X-MAN已經(jīng)全面升級到第四代X-MAN 4.0,為AI和HPC等計(jì)算場景進(jìn)行了新的優(yōu)化設(shè)計(jì)。

在配置上,每臺X-MAN 4.0包含8張 A100-80G NVLink GPU,并可支持8張200Gb/s的InfiniBand網(wǎng)卡,實(shí)現(xiàn)了高速存儲,高速無阻網(wǎng)絡(luò),高性能計(jì)算于一體的超級AI計(jì)算機(jī)。

在架構(gòu)上,X-MAN 4.0全新設(shè)計(jì)的架構(gòu)縮短了數(shù)據(jù)傳輸延遲,提高了數(shù)據(jù)傳輸帶寬,有效解決本地?cái)?shù)據(jù)傳輸?shù)耐ㄐ牌款i,降低AI作業(yè)中GPU的閑置時間。在MLCommons 1.1榜單中,X-MAN 4.0在同配置單機(jī)硬件性能名列TOP2。

同時為了實(shí)現(xiàn)更高的集群運(yùn)行性能,百度智能云專門設(shè)計(jì)了適用于超大規(guī)模集群的InfiniBand網(wǎng)絡(luò)架構(gòu),此架構(gòu)優(yōu)化了網(wǎng)絡(luò)收斂比,提升了網(wǎng)絡(luò)吞吐能力,并且結(jié)合容錯、交換機(jī)和拓?fù)溆成涞仁侄?,得以將EFLOPS級算力的計(jì)算集群性能發(fā)揮到極致。

重磅技術(shù)咖為你深度剖析產(chǎn)品特點(diǎn)、應(yīng)用與場景

3月16日19點(diǎn),智東西公開課聯(lián)合百度智能云、英偉達(dá),策劃推出的「百度智能云&英偉達(dá)新一代高性能AI計(jì)算集群」線上分享會。

本次分享會將由百度智能云的異構(gòu)計(jì)算產(chǎn)品經(jīng)理玄凌博、資深研發(fā)工程師孫鵬、資深系統(tǒng)工程師武正輝,以及英偉達(dá)解決方案架構(gòu)師程帥四位技術(shù)專家參與,將圍繞新一代高性能AI計(jì)算集群中的技術(shù)方案和應(yīng)用進(jìn)行深入剖析。

首先,百度智能云的玄凌博演講主題為《GPU云產(chǎn)品體系介紹和應(yīng)用場景分享》。將全面介紹百度智能云GPU云產(chǎn)品體系的各類產(chǎn)品特點(diǎn),以及其典型應(yīng)用場景,從而幫助用戶選出合適GPU云產(chǎn)品,加速AI業(yè)務(wù)發(fā)展。

其次,百度智能云的孫鵬將以《超大規(guī)模AI異構(gòu)計(jì)算集群的設(shè)計(jì)和優(yōu)化》為主題帶來分享。除了介紹EFLOPS級超AI異構(gòu)計(jì)算集群的IB網(wǎng)絡(luò)設(shè)計(jì)方法,孫鵬還將分享保證其高效運(yùn)行的軟硬件優(yōu)化的最佳實(shí)踐,并揭秘超大AI模型訓(xùn)練中的強(qiáng)大計(jì)算實(shí)力。

再次,百度智能云的武正輝將通過《超級AI計(jì)算機(jī)X-MAN技術(shù)揭秘》這一主題,深入介紹X-MAN的技術(shù)架構(gòu)演講歷程,并重點(diǎn)分析不斷推陳出新的技術(shù)特點(diǎn)和關(guān)鍵能力,是如何使其最終成為超大規(guī)模AI高性能計(jì)算集群中的硬件底座。

最后,英偉達(dá)解決方案架構(gòu)師程帥將就《NVIDIA SuperPOD 賦能AI數(shù)據(jù)中心》這一主題,對NVIDIA SuperPOD 參考架構(gòu)的設(shè)計(jì)特點(diǎn),以及其在全球的落地案例進(jìn)行分享。

本次分享會除了將在智東西公開課知識店鋪上進(jìn)行視頻直播,也會在“百度智能云的朋友們”B站企業(yè)號和“百度智能云”視頻號,以及“智猩猩”視頻號上進(jìn)行同步直播,想了解更多技術(shù)內(nèi)容嗎?想線上面對面和技術(shù)咖們battle技術(shù)嗎?即刻點(diǎn)擊鏈接https://mp.weixin.qq.com/s/aCvi4E8S217AJ4EOxUdnAA,加入我們

關(guān)鍵詞: 百度智能云&英偉達(dá)新一代高性能AI計(jì)算集群線上分享會下

 

網(wǎng)站介紹  |  版權(quán)說明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號:京ICP備2022016840號-16 營業(yè)執(zhí)照公示信息版權(quán)所有 郵箱聯(lián)系:920 891 263@qq.com