【資料圖】
央廣網(wǎng)北京6月24日消息(記者卜葉)近日,中國科學(xué)院軟件研究所與中國科學(xué)院大學(xué)等單位合作,在代碼審查意見自動(dòng)生成方法研究方面取得進(jìn)展。該研究提出了基于代碼審查標(biāo)記和預(yù)訓(xùn)練模型的代碼審查意見自動(dòng)生成方法,能夠高效地對(duì)代碼片段自動(dòng)生成有意義的代碼審查意見,幫助開發(fā)人員提高代碼質(zhì)量,緩解現(xiàn)有軟件開發(fā)過程中嚴(yán)重依賴少數(shù)高水平程序員進(jìn)行代碼審查的難題,為提升軟件開發(fā)過程中代碼審查自動(dòng)化能力起到重要支撐作用。
代碼審查是保障軟件質(zhì)量的重要過程,然而在實(shí)際軟件開發(fā)中,該過程往往嚴(yán)重依賴少數(shù)高水平程序員才能完成,一方面這可能造成多個(gè)軟件開發(fā)過程中斷并延遲,另一方面,即使是高水平程序員經(jīng)驗(yàn)也是有限的,他們需要花費(fèi)大量的時(shí)間進(jìn)行代碼審查,而且并不能保證審查出所有的代碼錯(cuò)誤或壞味。
針對(duì)此問題,研究團(tuán)隊(duì)提出一種基于代碼審查標(biāo)記和預(yù)訓(xùn)練模型的代碼審查意見自動(dòng)生成方法AUGER。他們從多個(gè)著名的Java項(xiàng)目中收集實(shí)際代碼審查數(shù)據(jù),通過代碼審查標(biāo)記嵌入技術(shù)構(gòu)建出一個(gè)高質(zhì)量數(shù)據(jù)集,利用T5預(yù)訓(xùn)練模型進(jìn)行多策略多階段訓(xùn)練。實(shí)驗(yàn)表明,該方法的ROUGE-L值相比于目前最好的方法提升了37.38%,且整個(gè)模型推理過程平均可在20秒內(nèi)完成。
關(guān)鍵詞: 新方法實(shí)現(xiàn)代碼審查意見自動(dòng)生成 代碼審查 預(yù)訓(xùn)練模型