(CWW)2022年1月28日,國際電信聯(lián)盟標準化局(ITU-T)在第16研究組的全會上正式凍結(jié)了中國信息通信研究院(以下簡稱“中國信通院”)云計算與大數(shù)據(jù)研究所牽頭制定的兩項數(shù)字人標準——ITU-T F.748.15 “Framework and metrics for digital human application system”(數(shù)字人應用系統(tǒng)基礎(chǔ)框架和評測指標)和ITU-T F.748.14 “Requirements and evaluation methods of non-interactive 2D real-person digital human application system”(非交互式2D真人形象類數(shù)字人應用系統(tǒng)指標要求和評估方法)。兩項國際標準即將于近期發(fā)布。
數(shù)字人作為一種全新的生成式人工智能技術(shù),市場前景廣闊,目前已經(jīng)在傳媒內(nèi)容播報、金融客戶服務、電商直播帶貨等場景孵化出典型應用。一方面能夠推動數(shù)字內(nèi)容生產(chǎn)從勞動密集型向科技密集型轉(zhuǎn)變,打造數(shù)字內(nèi)容生成新范式;另一方面可塑造視聽雙通道的多模態(tài)交互體驗,有效賦能行業(yè)。2021年以來,在元宇宙概念的刺激下,數(shù)字人技術(shù)應用呈現(xiàn)蓬勃發(fā)展態(tài)勢。但由于技術(shù)實力和成本等原因,市場上數(shù)字人產(chǎn)品質(zhì)量良莠不齊,造成各行業(yè)對數(shù)字人的應用信心不足。
為引導數(shù)字人產(chǎn)業(yè)健康發(fā)展,促進數(shù)字人技術(shù)、產(chǎn)品進步,2021年4月,中國信通院牽頭在ITU-T SG16的Q5(第五課題組——Artificial intelligence-enabled multimedia applications)成功立項了“數(shù)字人應用系統(tǒng)基礎(chǔ)框架和評測指標”和“非交互式2D真人形象類數(shù)字人應用系統(tǒng)指標要求和評估方法”的標準研制項目。這兩項標準在研究與編制過程中受到了多方關(guān)注,經(jīng)過與英國、加拿大、俄羅斯、美國、日本等國際專家的深入研討,最終在2022年1月的SG16全會上就技術(shù)內(nèi)容達成一致,獲全會通過,成功凍結(jié)。
ITU-T F.748.15聚焦于數(shù)字人應用系統(tǒng),首次明確了數(shù)字人(“digital human”)的定義,提出了數(shù)字人應用系統(tǒng)的參考框架,并分別從形象、語音、動作、交互處理、多模態(tài)輸入、多模態(tài)輸出等維度規(guī)范了相應的技術(shù)評估指標。該標準作為數(shù)字人技術(shù)、產(chǎn)品和服務評估指南,可以幫助相關(guān)方評估和比較不同的數(shù)字人應用系統(tǒng),對于數(shù)字人應用系統(tǒng)研發(fā)、選型、測試等都具有很強的指導意義。
ITU-T F.748.14則是面向非交互式2D真人形象類數(shù)字人應用系統(tǒng),定義了2D數(shù)字人、2D真人形象類數(shù)字人、非交互式數(shù)字人的相關(guān)概念,并結(jié)合ITU-T F.748.15,從形象、語音、動作、多模態(tài)輸入、多模態(tài)輸出等維度提出了相應的指標要求以及具體的評估方法。該標準的輸出,對指導非交互式2D真人形象類數(shù)字人應用系統(tǒng)的設(shè)計與開發(fā),促進相應產(chǎn)品成熟,具有非常深遠的意義。
這兩項數(shù)字人國際標準均由中國信通院牽頭并擔任編輯人(Editor)。其評測指標和測試方法均采納了中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟及內(nèi)容科技產(chǎn)業(yè)推進方陣的評估規(guī)范和中國通信標準化協(xié)會行業(yè)標準的相關(guān)內(nèi)容,參與單位包括百度、騰訊、南京新一代人工智能研究院有限公司、凌云光、網(wǎng)易、商湯、央視網(wǎng)、科大訊飛、北京航空航天大學等20余家企業(yè)、高校及科研機構(gòu)。
數(shù)字人國際標準的正式凍結(jié),標志著我國在數(shù)字人領(lǐng)域評測能力得到了國際認可,是我國數(shù)字人科研人員對國際標準化研究的重要貢獻,也為我國數(shù)字人技術(shù)、產(chǎn)品和評測走出國門開辟了道路。
關(guān)鍵詞: 通信世界網(wǎng) 中國信息通信研究院 數(shù)字人標準