當(dāng)前熱訊:各大模型在高考中表現(xiàn)如何?科大訊飛星火數(shù)學(xué)題正確率50% 排名第一

發(fā)布時(shí)間:2023-06-09 15:37:18  |  來源:快科技  


(資料圖片僅供參考)

快科技6月9日消息,科大訊飛于今日舉辦訊飛星火認(rèn)知大模型V1.5 升級發(fā)布會,正式發(fā)布訊飛星火認(rèn)知大模型V1.5,該模型的開放式問答能力取得突破,多輪對話和數(shù)學(xué)能力再升級,文本生成、語言理解、邏輯推理能力持續(xù)提升。

發(fā)布會上,科大訊飛展示了大模型在今年高考中的答題能力,科大訊飛星火力壓群雄,成為了解題正確率最高、“最聰明”的AI大模型。

數(shù)學(xué)題目測試中,媒體選擇了數(shù)學(xué)高考試卷前10道填空題,讓百度文心一言、阿里通義千問、科大訊飛星火認(rèn)知大模型、360智腦、ChatGPT進(jìn)行回答。

測試結(jié)果顯示,這五款大模型在答數(shù)學(xué)題的能力上差異顯著。

最“聰明”的訊飛星火答對了5題,正確率50%,大模型數(shù)學(xué)能力排名第一。百度文心一言和ChatGPT“緊跟其后”,答對了4題,正確率為40%。

而在語文主觀作答中,ChatGPT高考作文得分最高,文心一言、訊飛星火得分稍低,但跟ChatGPT處于同一水平。至于英語考試,訊飛星火、ChatGPT顯著領(lǐng)先其它各家。

此外,值得關(guān)注的是,在今日訊飛星火大模型V1.5迭代升級后,其數(shù)學(xué)能力將會再上一個(gè)臺階。

關(guān)鍵詞:

 

網(wǎng)站介紹  |  版權(quán)說明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號:京ICP備2022016840號-16 營業(yè)執(zhí)照公示信息版權(quán)所有 郵箱聯(lián)系:920 891 263@qq.com