談及辯論,在行的除了人類 BB King,還有 “機(jī)器杠精”。早在 2018 年 6 月,IBM 的 AI 辯手 Project Debater 擊敗以色列國際辯論協(xié)會主席 Dan Zafrir 和 2016 年以色列國家辯論冠軍 Noa Ovadia,一戰(zhàn)成名。
轉(zhuǎn)眼 3 年過去,號稱「首個(gè)能在復(fù)雜話題上與人類辯論的 AI 系統(tǒng)」的 Project Debater 更是出現(xiàn)在最新一期 Nature 雜志封面上。
AI 走出「舒適區(qū)」
2021 年 3 月 17 日,IBMResearch 題為 An autonomous debating system(自主辯論系統(tǒng))的論文正式發(fā)表于 Nature。
AI 被定義為 “可以執(zhí)行有智慧的生物所能完成的任務(wù)的機(jī)器” 。而眾所周知,爭論、辯論是體現(xiàn)人類智力的一個(gè)基本方式,也是人類眾多活動所必需的、人類社會共有的能力。因此,提升計(jì)算機(jī)對自然語言的理解和處理能力、發(fā)展論證技術(shù),已成為 AI 研究的一個(gè)新興方向。
多年前,即便是最為先進(jìn)的 AI,也不能很好地做到對人類話語進(jìn)行分析、確定論據(jù)如何用于支持結(jié)論(這一過程被稱為論點(diǎn)挖掘)。
后來,隨著 AI 技術(shù)的進(jìn)步和論證技術(shù)工程日益成熟,加之商業(yè)需求強(qiáng)烈,這一領(lǐng)域開始迅速發(fā)展。據(jù)悉,當(dāng)前全世界有 50 余個(gè)實(shí)驗(yàn)室正在研究這一問題,其中就包括所有大型軟件公司的研究團(tuán)隊(duì)。
來自英國鄧迪大學(xué)辯論技術(shù)中心(Centre for Argument Technology)的 Chris Reed 認(rèn)為,這一領(lǐng)域之所以能呈現(xiàn)快速發(fā)展之勢的一個(gè)原因便是:AI 系統(tǒng)可識別大量文本中語言使用的規(guī)律,這已在許多應(yīng)用中產(chǎn)生了變革,但其本身在論點(diǎn)挖掘方面卻并不成功。
繼續(xù)深究便能發(fā)現(xiàn)其原因:論點(diǎn)結(jié)構(gòu)太多變、太復(fù)雜、太微妙,且常常太隱蔽,難以像句子結(jié)構(gòu)那樣易識別。
基于這一大背景,IBM 提出了 Project Debater,即一個(gè)可以與人類打辯論的自主系統(tǒng),這一系統(tǒng)通過掃描儲存了 4 億篇新聞報(bào)道和來自維基百科的內(nèi)容。
論文中,IBM 對其系統(tǒng)架構(gòu)進(jìn)行了完整的描述、全面系統(tǒng)的評估。
值得一提的是,IBM 強(qiáng)調(diào)了 AI 與人類辯論、AI 在游戲中挑戰(zhàn)人類之間的根本區(qū)別。
IBM 認(rèn)為,后者是過去幾十年里 AI 研究學(xué)者們主要追求的經(jīng)典挑戰(zhàn),它尚存在于 AI 的 “舒適區(qū)”內(nèi)——而 AI 與人類辯論顯然意味著 AI 已走出了 “舒適區(qū)”,畢竟在辯論中人類仍占上風(fēng),需要新的范式才能取得實(shí)質(zhì)性進(jìn)展。
正如 Chris Reed 評論的那樣:這一論文表明,該領(lǐng)域的研究已取得了長足進(jìn)步。
Project Debater成為工程壯舉
在 Chris Reed 看來,Project Debater 是一個(gè)巨大的工程壯舉。
具體而言,Project Debater 涵蓋了:
文本中收集、解釋與論證相關(guān)的材料的新方法
修復(fù)句子語法的方法(主要是為了系統(tǒng)在論證時(shí)重新部署所提取的句子片段)
圍繞著關(guān)鍵主題,上述方法與人類預(yù)先準(zhǔn)備的信息結(jié)合在一起,將提供相關(guān)的知識、論證和反駁。實(shí)際上,這個(gè)知識庫還將以人類預(yù)先寫好的句子片段作為補(bǔ)充,這樣一來,在打辯論時(shí)準(zhǔn)備、介紹演示文稿也不在話下。
其主要流程是:
查詢相關(guān)論據(jù)的高傾向性句子;
使用神經(jīng)模型,對句子代表論據(jù)的概率進(jìn)行一個(gè)排序;
結(jié)合神經(jīng)網(wǎng)絡(luò)、基于知識,對每個(gè)論點(diǎn)立場做一個(gè)分類。
Chris Reed 對Project Debater 的評價(jià)是:
無論是作為一個(gè) AI 系統(tǒng),還是一項(xiàng) AI 領(lǐng)域的重大挑戰(zhàn),Project Debater 都是非常有野心的。
這背后的邏輯是,幾乎所有的 AI 研究都把眼光放得很高,而一個(gè)關(guān)鍵問題就在于獲取足夠的數(shù)據(jù)、計(jì)算出有效解決方案。對此,Project Debater 通過一種雙管齊下的方式解決了這一障礙:一方面,僅著眼于百余個(gè)辯論主題;另一方面,從龐大的數(shù)據(jù)集中獲取材料作為支撐。
無疑,Project Debater 目前并非做到了完美的程度。
目前來看,或許這一系統(tǒng)最大的弱勢在于難以模仿人類辯手的連貫性和流暢性,其實(shí)這與其處理程序選擇、提取和組織語言的水平有關(guān)。
當(dāng)然這種限制并不僅僅出現(xiàn)在 Project Debater 身上——盡管人們對論證的研究已經(jīng)進(jìn)行了兩千年,但人們對其結(jié)構(gòu)仍然知之甚少。畢竟,對于一個(gè)連貫的論證推理模型而言,辯論研究的重點(diǎn)不同(是語言使用、認(rèn)識論、認(rèn)知過程還是邏輯有效性),關(guān)鍵特征也將有很大的不同。
因此,什么是好的論點(diǎn)模型,本身就是一大難題。
AI 辯手一戰(zhàn)成名
Project Debater 在實(shí)戰(zhàn)中表現(xiàn)如何,想必密切關(guān)注 AI 領(lǐng)域發(fā)展的小伙伴早有耳聞。
首先在 2018 年 6 月 18 日,IBM 舊金山辦公室,Project Debater 迎戰(zhàn)兩位頂尖人類辯手:以色列國際辯論協(xié)會主席 Dan Zafrir 和 2016 年以色列國家辯論冠軍 Noa Ovadia。
在兩場以「4 分鐘開場演講 - 4 分鐘反駁 - 2 分鐘論證總結(jié)」為流程的辯論中,人類辯手首先發(fā)言,然后 Project Debater 進(jìn)行反駁。
Project Debater 通過處理大量文本,就主題構(gòu)建出了結(jié)構(gòu)良好的演講,觀點(diǎn)清晰明確。據(jù)外媒 Engadget 報(bào)道,Project Debater 拋出了不少自方觀點(diǎn),同時(shí)還根據(jù)對手發(fā)言做了流利的反駁。最終,Project Debater 比 Dan Zafrir 多獲得 9 票,贏得了比賽。
隨后在2019 年 2 月 11 日,Project Debater與 2016 年世界大學(xué)辯論錦標(biāo)賽總決賽選手、2012 年歐洲大學(xué)辯論錦標(biāo)賽冠軍 Harish Natarajan 現(xiàn)場較量,最終人類辯手獲得勝利。
2019 年 11 月 21 日,劍橋大學(xué)舉辦了一場辯題為 “AI 誕生是否弊大于利”的比賽,Project Debater 再次迎戰(zhàn)人類辯手。
從結(jié)果來看,Project Debater 的支持率為 51%,以微弱的優(yōu)勢取勝。
但拋開票數(shù)來看,不少人認(rèn)為:
IBM AI 機(jī)器人在很多方面的表現(xiàn)遠(yuǎn)遠(yuǎn)比不上人類辯手,通過這場辯論賽可以明顯反映出,AI 辯手與人類辯手之間還存在著巨大的差距,比如句子的結(jié)構(gòu)不正確,或發(fā)表無法令人信服的論點(diǎn)。
不過,當(dāng)時(shí) IBM 也對 Project Debater 做了新的改進(jìn),比如評估出質(zhì)量更好的論點(diǎn)、檢測出人類辯手詞匯冗余的論點(diǎn),甚至基于一個(gè)笑話庫,變得幽默起來。
古羅馬時(shí)期,著名政治家、哲人西塞羅曾說過:
辯才是人類最光輝的美德之一。
自蘇格拉底時(shí)期起,辯論就是人類生活最為重要的一部分,理性、智慧之光閃耀其中。未來 AI 如何更好地?fù)碛羞@項(xiàng)技能,我們拭目以待。