(CWW)8月19日,在2023中國算力大會期間,由中國信息通信研究院和中國互聯(lián)網(wǎng)協(xié)會聯(lián)合主辦的“先進數(shù)據(jù)存力”論壇在寧夏銀川舉辦。論壇邀請產(chǎn)、學(xué)、研、用各界專家一起探討先進存力發(fā)展、可信存力建設(shè)、數(shù)據(jù)高效流動等產(chǎn)業(yè)熱點話題,并發(fā)布系列數(shù)據(jù)存力成果,推動中國存力高質(zhì)量發(fā)展。
華為公司副總裁、數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰博士受邀出席論壇并發(fā)表“先進數(shù)據(jù)存力,做AI大模型時代領(lǐng)先者”主題演講。他表示,我國數(shù)據(jù)存儲產(chǎn)業(yè)有望成為國家科技新名片,發(fā)展先進的數(shù)據(jù)存力是確保AI大模型時代國家基礎(chǔ)設(shè)施領(lǐng)先的關(guān)鍵。
(資料圖)
人工智能的進化,是不斷收集和分析數(shù)據(jù)的過程。數(shù)據(jù)作為信息的載體,是人工智能學(xué)習(xí)和理解世界的原料。通用智能作為人工智能發(fā)展的終極目標,能夠自主地學(xué)習(xí)、理解、推理和解決問題,其最大的驅(qū)動力是數(shù)據(jù)。
周躍峰認為,數(shù)據(jù)質(zhì)量決定機器AI智能的高度:缺數(shù)據(jù),無AI。數(shù)據(jù)質(zhì)量越高,越有價值的數(shù)據(jù)給人工智能提供更可靠的輸入,AI服務(wù)能力越智能。
AI大模型由數(shù)據(jù)、算力、算法三要素構(gòu)成。當下算力逐漸趨同、算法逐漸收斂,而數(shù)據(jù)仍在蓬勃發(fā)展,在AI大模型進行準備、預(yù)處理、訓(xùn)練、推理的全生命周期過程中,先進數(shù)據(jù)存力是構(gòu)建AI差異化優(yōu)勢的關(guān)鍵。發(fā)展先進數(shù)據(jù)存力,未來應(yīng)聚焦新型數(shù)據(jù)范式、先進介質(zhì)應(yīng)用、數(shù)據(jù)安全可靠這三個方面的創(chuàng)新:
●新型數(shù)據(jù)范式:以存補算,突破算力局限
通過近存計算實現(xiàn)近數(shù)據(jù)預(yù)處理,讓數(shù)據(jù)在存儲完成部分過濾、歸一、轉(zhuǎn)碼與增強的數(shù)據(jù)準備任務(wù),減少數(shù)據(jù)搬移,從而提升GPU利用率。同時,把企業(yè)最新垂直化的數(shù)據(jù)進行向量化存儲和檢索,大幅度降低企業(yè)接入和使用AI大模型的難度。
●先進介質(zhì)應(yīng)用:加速SSD應(yīng)用,夯實領(lǐng)先基礎(chǔ)
根據(jù)IDC統(tǒng)計,目前企業(yè)級與消費級SSD硬盤達到80%,已成為一種趨勢。相比HDD,全閃存介質(zhì)支持高IOPS、低時延,更適用于AI大模型訓(xùn)練階段的隨機讀寫場景。另外SSD的功耗僅為HDD的20%,適配AI大模型的低碳目標。因此,AI大模型時代應(yīng)加速推進高性能、低功耗的全閃存介質(zhì)應(yīng)用。
●數(shù)據(jù)安全可靠:存儲內(nèi)生安全,構(gòu)筑數(shù)據(jù)安全最后一道防線
存儲內(nèi)生安全體系架構(gòu)從存儲設(shè)備安全、數(shù)據(jù)安全防護能力,結(jié)合安全管理流程,為AI大模型構(gòu)筑數(shù)據(jù)安全最后一道防線。最后,周躍峰表示,我國數(shù)據(jù)存儲產(chǎn)業(yè)正在蓬勃發(fā)展,從芯片到部件,再到整機,我國已經(jīng)具備全??煽氐拇鎯Ξa(chǎn)業(yè)鏈。以華為為代表的存儲企業(yè)快速突圍,持續(xù)投入,有望將數(shù)據(jù)存儲產(chǎn)業(yè)打造成為國家科技的新名片。
關(guān)鍵詞: