它還挑戰(zhàn)了關(guān)于自動(dòng)駕駛汽車的某些假設(shè)
為了在不失控的情況下沿著最快的“賽馬線”在拐角處疾馳,賽車手必須按精確的順序剎車、轉(zhuǎn)向和加速。這個(gè)過程取決于摩擦的極限,它們受已知物理定律的約束——這意味著自動(dòng)駕駛汽車可以學(xué)會(huì)以盡可能快的速度完成一圈(正如一些人已經(jīng)做的那樣)。但當(dāng)自動(dòng)司機(jī)不得不與其他汽車共享空間時(shí),這就變成了一個(gè)棘手的問題?,F(xiàn)在,科學(xué)家通過訓(xùn)練人工智能計(jì)劃,在超現(xiàn)實(shí)的賽車游戲Gran Turismo Sport上擊敗人類競爭對手。這些發(fā)現(xiàn)可能會(huì)為自動(dòng)駕駛汽車研究人員指明,以新的方式使這項(xiàng)技術(shù)在現(xiàn)實(shí)世界中發(fā)揮作用。
人工智能已經(jīng)征服了某些電子游戲中的人類玩家,如《星際爭霸II》和《Dota 2》。但Sony AI America總監(jiān)、本周發(fā)表在《自然》雜志上的新研究的合著者Peter Wurman說,Gran Turismo與其他游戲有很大不同。他解釋說:“在大多數(shù)游戲中,環(huán)境定義了規(guī)則,并保護(hù)用戶相互傷害。”“但在賽車中,汽車非常接近,[AI]特工必須學(xué)習(xí)和部署一種非常精致的禮儀感。為了獲勝,他們必須尊重對手,但他們還必須保留自己的駕駛路線,并確保他們不會(huì)只是讓步?!?/p>
索尼人工智能研究人員使用了一種名為深度強(qiáng)化學(xué)習(xí)的技術(shù)。他們獎(jiǎng)勵(lì)人工智能的某些行為,例如留在賽道上,繼續(xù)控制車輛和尊重賽車禮儀。然后,他們放寬了程序,嘗試不同的賽車方式,使其能夠?qū)崿F(xiàn)這些目標(biāo)。索尼人工智能團(tuán)隊(duì)訓(xùn)練了多個(gè)不同版本的人工智能,稱為Gran Turismo Sophy(GT Sophy),每個(gè)版本都專門在一條特定軌道上駕駛一種特定類型的汽車。然后,研究人員將該項(xiàng)目與人類Gran Turismo冠軍對立起來。在去年7月進(jìn)行的第一次測試中,人類的總體得分最高。在2021年10月的第二次運(yùn)行中,人工智能突破了。它單獨(dú)或作為一個(gè)團(tuán)隊(duì)擊敗了人類敵人,實(shí)現(xiàn)了最快的圈速。
有些人喜歡將自己的智慧與人工智能對立起來。Sony AI戰(zhàn)略和伙伴關(guān)系總監(jiān)Erica Kato Marcus說:“我們也從司機(jī)那里聽到的一些事情是,他們也從Sophy的策略中學(xué)到了新東西。”“人工智能使用的線路太棘手了,我可能可以做一次。但這是很困難的——我永遠(yuǎn)不會(huì)在比賽中嘗試它,”Emily Jones說,她是國際汽聯(lián)認(rèn)證的2020年Gran Turismo錦標(biāo)賽的世界決賽選手,后來與GT Sophy比賽。盡管瓊斯說,與人工智能競爭讓她感到有點(diǎn)無能為力,但她形容這次經(jīng)歷令人印象深刻。
Jones說:“像許多運(yùn)動(dòng)一樣,賽車都是為了盡可能接近完美的路徑,但你永遠(yuǎn)無法真正到達(dá)那里?!薄坝辛薙ophy,看到完美路徑的東西真是太瘋狂了。沒有辦法走得更快。”
索尼團(tuán)隊(duì)目前正在進(jìn)一步開發(fā)人工智能。Wurman說:“我們?yōu)槊總€(gè)車道組合訓(xùn)練了一名特工,GT Sophy的版本。”“我們正在研究的一件事是:我們是否可以訓(xùn)練一項(xiàng)可以在游戲中任何賽道上在任何汽車上運(yùn)行的單一規(guī)則?”在商業(yè)方面,索尼人工智能還與索尼互動(dòng)娛樂子公司Polyphony Digital Gran Turismo的開發(fā)商合作,以潛在地將GT Sophy的版本納入游戲的未來更新中。為此,研究人員需要調(diào)整人工智能的表現(xiàn),使其成為一個(gè)具有挑戰(zhàn)性的對手,但不是無敵的——即使對于比迄今為止測試過人工智能的冠軍技能較低的玩家來說也是如此。
由于Gran Turismo提供了特定汽車和特定軌道的逼真的近似值——以及管轄每個(gè)軌道的獨(dú)特物理參數(shù)——這項(xiàng)研究也可能在電子游戲之外有應(yīng)用。人工智能研究公司OpenAI的軟件工程師、在Dota 2擊敗人類的OpenAI Five項(xiàng)目的合著者Brook Chan說:“我認(rèn)為其中一件有趣的作品確實(shí)將此與Dota游戲區(qū)分開來,是在基于物理的環(huán)境中?!監(jiān)penAI Five項(xiàng)目擊敗了人類?!八辉诂F(xiàn)實(shí)世界中,但仍然能夠模仿現(xiàn)實(shí)世界的特征,以便我們訓(xùn)練人工智能來更多地了解物理世界?!保–han沒有參與GT Sophy研究。)
J說:“Gran Turismo是一個(gè)非常好的模擬器——它通過幾種方式進(jìn)行游戲化,但它確實(shí)忠實(shí)地代表了不同汽車和不同軌道的許多差異?!盋hristian Gerdes,斯坦福大學(xué)機(jī)械工程教授,沒有參與這項(xiàng)新研究?!霸谖铱磥?,這是與發(fā)表論文的人最接近的事情,該論文說人工智能可以在賽車環(huán)境中與人類面對面?!?/p>
然而,并非每個(gè)人都完全同意。加州大學(xué)伯克利分校運(yùn)輸研究所加州高級運(yùn)輸技術(shù)合作伙伴(California PATH)項(xiàng)目的研究工程師Steven Shladover說:“在現(xiàn)實(shí)世界中,你必須處理騎自行車的人、行人、動(dòng)物、從卡車上掉下來和掉進(jìn)你必須避免的事情、惡劣的天氣、車輛故障等?!彼矝]有參與《自然》論文?!斑@些東西都不是出現(xiàn)在游戲世界中?!?/p>
但Gerdes說,GT Sophy的成功仍然有用,因?yàn)樗嵏擦岁P(guān)于自動(dòng)駕駛汽車必須編程方式的某些假設(shè)。自動(dòng)飛行器可以根據(jù)物理定律或其人工智能訓(xùn)練做出決定。Gerdes說:“如果你看看文獻(xiàn)中的內(nèi)容——以及在一定程度上人們在路上放的東西——運(yùn)動(dòng)規(guī)劃器在優(yōu)化中往往基于物理,感知和預(yù)測部分將是人工智能。”然而,對于GT Sophy來說,人工智能的運(yùn)動(dòng)規(guī)劃(例如決定如何在不造成崩潰的情況下接近其性能上限的拐角)是基于公式的人工智能方面。他說:“我認(rèn)為自動(dòng)化汽車開發(fā)商的教訓(xùn)是:這里有一個(gè)數(shù)據(jù)點(diǎn),也許我們一些先入為主的概念——這個(gè)問題的某些部分最好在物理上完成——需要重新審視?!薄叭斯ぶ悄芸赡芤材茉谀抢锿??!?/p>
Gerdes還表示,GT Sophy的成就可以為人類和自動(dòng)化系統(tǒng)相互作用的其他領(lǐng)域提供經(jīng)驗(yàn)教訓(xùn)。他指出,在Gran Turismo中,人工智能必須在實(shí)現(xiàn)賽道最快路線的難題與通常不可預(yù)測的人類平穩(wěn)互動(dòng)的難題之間取得平衡。Gerdes說:“如果我們確實(shí)有一個(gè)人工智能系統(tǒng),可以在這種環(huán)境中做出一些復(fù)雜的決定,這可能具有適用性——不僅適用于自動(dòng)駕駛,還適用于機(jī)器人輔助手術(shù)或幫助家庭周圍的機(jī)器等互動(dòng)。如果你的任務(wù)是人類和機(jī)器人一起移動(dòng)某物,那么在某些方面,這比機(jī)器人試圖自己移動(dòng)要棘手得多。
關(guān)鍵詞: AI在電子游戲Gran Turismo上擊敗了人類冠軍 人工智能