(相關(guān)資料圖)
作為國產(chǎn)CPU的代表之一,龍芯這兩年已經(jīng)將架構(gòu)轉(zhuǎn)向自研的LoongArch指令集,號稱100%自主,現(xiàn)在還在不斷擴展LoongArch的應(yīng)用領(lǐng)域,今天龍芯宣布支持了NCNN神經(jīng)網(wǎng)絡(luò)計算框架,各項性能比通用實現(xiàn)普遍提升一倍以上。
據(jù)龍芯介紹,近期經(jīng)過龍芯中科與NCNN社區(qū)的共同努力,在NCNM中使用龍架構(gòu)(LoongArch)向量優(yōu)化實現(xiàn)了大部分算子,得益于龍架構(gòu)向量的高效實現(xiàn),優(yōu)化后NCNN在平臺上各項性能測試比通用實現(xiàn)普遍提升一倍以上。
NCNN作為業(yè)界首個為移動端優(yōu)化的神經(jīng)網(wǎng)絡(luò)前向計算框架,在2017年首次開源,是騰訊優(yōu)圖實驗室第一次對外公開深度學(xué)習(xí)的研究成果。
目前多應(yīng)用在圖像方面,例如人像自動美顏,照片風(fēng)格化,超分辨率,物體識別等等。NCNN計算框架,因其高性能、無第三方依賴、跨平臺支持大部分常見CNN網(wǎng)絡(luò)的特點,是許多開發(fā)者在移動端、嵌入式設(shè)備上部署深度學(xué)習(xí)算法的首選框架。
本次優(yōu)化共產(chǎn)出3萬多行代碼,成果將應(yīng)用于龍芯AI邊緣計算場景,完成基于龍架構(gòu)平臺的特征識別、圖像處理、人臉識別等模型的部署和推理,如門禁系統(tǒng)、手勢識別、口罩檢測等等。依托于NCNN計算框架優(yōu)秀的低耦結(jié)構(gòu),開發(fā)者只需關(guān)注算子在龍架構(gòu)平臺上的高效實現(xiàn),無需考慮整個系統(tǒng)結(jié)構(gòu)問題,實現(xiàn)更高效的開發(fā)與部署工作。
(8082177)
關(guān)鍵詞: 如此操作讓100%自研指令集國產(chǎn)CPU性能輕松翻倍 ncnn