四足機器人對于大家來說應該已經(jīng)不再陌生,盡管大多數(shù)人還只能從媒體或者企業(yè)的演示視頻中看到它們的身影,但我們相信它們已經(jīng)從科幻電影的屏幕中走了出來。當然那些機器人工程師們?nèi)栽谘芯咳绾巫屵@些機器擁有更多的功能,讓它們真正走入人們生活中。
現(xiàn)在,麻省理工學院(MIT)的一組研究人員表示,改善機器人功能的一種方法可能是使用人工智能幫助教機器人如何走路和跑步。
以往,當工程師們在開發(fā)控制有腿機器人運動的軟件時,他們會編寫一套規(guī)則,規(guī)定機器應該如何響應特定的輸入。因此,如果機器人的傳感器檢測到y(tǒng)腿上有x個力,它就會通過給電機a供電來施加力矩b,以此類推。對這些參數(shù)進行編碼既復雜又耗時,但它可以讓研究人員對機器人進行精確和可預測的控制。
另一種方法是使用機器學習(ML)——更進一步來說,這種方法被稱為強化學習(RL),通過反復試驗來發(fā)揮作用。通過給你的AI模型一個稱為“獎勵功能”的目標(例如,盡可能快地移動),然后讓它自行想出如何從零開始實現(xiàn)這個結(jié)果。這需要很長時間,但可以讓AI在虛擬環(huán)境中進行實驗,就可以加快時間。這就是為什么強化學習是開發(fā)電子游戲中人工智能的流行方式。
MIT的工程師們就是使用這種技術(shù),他們?yōu)樽约旱乃淖銠C器人研究項目“迷你獵豹”(Mini Cheetah)開發(fā)了一種新的控制軟件。通過強化學習,他們能夠為機器人實現(xiàn)3.9米/秒的最高速度,達到大約14公里/小時。
迷你獵豹跑步的步態(tài)有點笨拙。事實上,它看起來就像一只小狗在木地板上抓來抓去的加速。但是工程師認為,這是因為人工智能除了速度之外沒有優(yōu)化任何其他東西。
深度學習找到了一種跑得快的方法,但由于其獎勵功能不明確,它沒有理由選擇一種“看起來自然”或人類喜歡的步態(tài)。這個模型當然可以用來指導開發(fā)一種更流暢(真實)的運動形式,但目前整個努力的重點只在優(yōu)化速度。
使用人工智能開發(fā)控制器軟件的一個很大的優(yōu)勢是,減少了浪費在物理上的時間。人工編程讓機器人在各種可能的情況下如何行動是非常困難的,而且這個過程很繁瑣,如果機器人在特定的地形上發(fā)生故障,人類工程師就需要確定故障的原因,并手動調(diào)整機器人控制器。
通過使用模擬器,工程師可以將機器人置于任何的虛擬環(huán)境中——從堅實的路面到光滑的碎石——并讓它自己解決問題。事實上,麻省理工學院的研究小組表示,他們的模擬器能夠在3個小時內(nèi)快速完成以往需要100天的蹣跚行走和跑步。
一些研發(fā)有腿機器人的公司已經(jīng)在使用這些方法來設計新的控制器。不過,以知名的波士頓動力公司(Boston Dynamics)為代表的一些公司仍然依賴更傳統(tǒng)的方法。因為該公司對開發(fā)非常具體而精準的動作感興趣,比如在其精心編排的視頻中可以看到雙足或四足機器人進行各種跳躍、翻轉(zhuǎn)、跨越障礙甚至舞蹈動作。
目前,波士頓動力公司的“獵豹”機器人保持著四足機器人的最高時速紀錄,達到45.5公里/小時,比博爾特還快。然而,獵豹的紀錄也許很快會被超越。畢竟它不僅比麻省理工學院的迷你獵豹更大,而且這個紀錄還是在跑步機上實現(xiàn)的,同時安裝了一個杠桿以保持穩(wěn)定性。如果沒有這些優(yōu)勢,人工智能驅(qū)動下的“小獵豹”也許會很快追上來。