10余架手掌大小、單機重量小于一聽可樂的微型空中機器人,在浙江安吉的一片竹林中騰空而起,在沒有GPS、動作捕捉系統(tǒng)、遠程通信運算或是預先建立環(huán)境地圖的情況下,各自獨立又協(xié)作地穿過低矮的灌木、傾斜的竹竿、起伏的地面、稠密的樹枝,如同一支協(xié)同卻又自主的鳥群。
這是浙江大學控制科學與工程學院高飛、許超團隊對全自主微型空中機器人的最新研究成果之一。團隊研發(fā)的微型且完全自主的空中機器人,能夠在高度混亂的野外環(huán)境中,根據(jù)機載傳感器提供的有限信息實現(xiàn)集群飛行。機器人上的軌跡規(guī)劃算法能夠自主規(guī)劃飛行路線,同時滿足飛行效率、避障、機器人間相互避碰、動力學可行性、集群協(xié)調(diào)等多種要求。
當?shù)貢r間5月4日,以上成果以《野外微型飛行機器人集群》(Swarm of micro flying robots in the wild)為題,并作為封面文章發(fā)表在機器人領域的國際頂刊《科學·機器人》(SCIENCE ROBOTICS)上。論文第一作者為浙大控制學院在讀博士生周鑫,通訊作者為高飛博士和許超教授。
在接受澎湃新聞(www.thepaper.cn)記者采訪時,浙大控制學院博導高飛表示,這一成果將為未來微型空中機器人集群以及相關算法應用在戶外救災、野外生物研究、協(xié)作運輸?shù)阮I域奠定基礎。
作為未來技術的象征,空中多機器人系統(tǒng)的靈活性已經(jīng)在諸多科幻電影中有所呈現(xiàn)。在《普羅米修斯》中,宇航員在決定走哪條路之前,釋放了幾個微型飛行裝置來探索一艘未知的外星飛船。在《安德的游戲》中,空中機器人集群系統(tǒng)包圍了宇宙飛船,形成了一個抵御外星人攻擊的盾牌,為人類掃清了一條贏得戰(zhàn)斗的道路。在《星球大戰(zhàn)前傳3》和《銀翼殺手2049》中,摩天大樓之間的空中交通在高科技星球上繁忙而有序的運行。
隨著處理器計算能力、感知和通信方面的發(fā)展,諸如四旋翼飛行器之類的空中機器人已經(jīng)進入大眾生活,這些飛行器不但具有高機動性,而且價格低廉。據(jù)《日本經(jīng)濟新聞》報道,DJI的Mavic Air 2是目前最暢銷的空中機器人之一,它擁有避障、跟蹤等功能,并且具有10公里的通信距離,其硬件成本僅約135美元。此外,空中機器人市場仍有大量的可能性,到2028年,空中機器人整體市場價值預計將達到5000億美元。
不過,盡管空中機器人自主導航在工業(yè)和學術實踐中都得到了快速的發(fā)展,但高度混亂的環(huán)境,如茂密的森林,仍然是空中機器人難以進入且自由穿梭的,更不用說成群的空中機器人。在這些場景中,未知的復雜環(huán)境和狹窄的可行空間會對空中機器人集群協(xié)調(diào)帶來極大的挑戰(zhàn)。
“在空中機器人的研究中,從單一機器人轉(zhuǎn)向協(xié)同的集群系統(tǒng),也是機器人智能發(fā)展的必然趨勢?!备唢w向澎湃新聞記者介紹說。空中機器人是高飛在香港科技大學攻讀博士學位時的主要研究領域,當時其研究方向主要為空中機器人單機導航。2019年底,高飛到浙江大學任職并開始帶領團隊開展空中機器人自主導航及集群技術研究,團隊為此次野外空中機器人集群論文準備了約兩年時間。
據(jù)了解,在混亂的野外環(huán)境下空中機器人集群導航之所以困難,是因為野外環(huán)境對空中機器人集群提出了四方面的要求,簡稱TEEM——軌跡最優(yōu)性(trajectory optimality), 可擴展性(extensibility,)、低成本計算需求(economical computing)和小型化(miniature size)。
軌跡最優(yōu)性反映了任務質(zhì)量和飛行時間,這種效率在緊急的救援情況下至關重要。軌跡最優(yōu)性要求面對各種復雜環(huán)境,都能夠允許空中機器人快速、安全、穩(wěn)定的飛行和穿越,這種性能在緊急救援情況和混亂狹窄環(huán)境中至關重要。
可擴展性指的是空中機器人對不同任務的需求在軟件硬件上的拓展能力,如針對多機協(xié)同目標跟蹤任務,既需要在軟件上增加識別功能又需要在硬件上拓展多方位鏡頭。
低計算成本需求非常重要,這允許了空中機器人攜帶更小的機載處理器,并且減少對變化環(huán)境和突發(fā)情況的反應時間,從而為其他用戶定義的任務(如目標檢測和決策)預留盡可能多的可用計算資源。
最后,所有這些能力應該放在最小的飛行器中,因為重量和體積直接關系到機器人的續(xù)航能力和對狹窄空間的穿越能力。
然而,這四個方面的要求卻是相互矛盾的,想要同時實現(xiàn)需要精確的權(quán)衡。例如,更高的軌跡最優(yōu)性要求復雜的建模和求解空間中的更多迭代求解次數(shù),這會極大的增加計算時間和計算成本。更高的可擴展性要求以更一般化的形式定義問題和任務,但要犧牲潛在的對特定任務的優(yōu)化。
“對于空中機器人集群來說,滿足安全性、動力學可行性、最小化時間以及最大化軌跡平滑度已經(jīng)是一項巨大的挑戰(zhàn),同時在微型平臺上實現(xiàn)更是難上加難。這就是為什么以前的研究無法從結(jié)構(gòu)化的、人為的環(huán)境走向不確定性的野外環(huán)境?!闭撐闹姓f。
在現(xiàn)實世界中,Intel、High Great和CollMot已經(jīng)展示了令人印象深刻的空中機器人編隊表演。然而,在大規(guī)模和成功的商業(yè)用途背后,使用全球?qū)Ш叫l(wèi)星系統(tǒng)定位的空中機器人編隊僅僅遵循預先設定的軌跡,無法在有障礙的野外地點操作。
為了解決這一問題,機器人研究者們試圖從大自然中找到靈感,即觀察大自然如何應對這種導航挑戰(zhàn)。在自然界,昆蟲執(zhí)行短期反應,而鳥類喜歡相對長期的平穩(wěn)動作。這是因為鳥類比昆蟲有著更敏銳的視覺和運動感覺、自由度更高的運動系統(tǒng)、以及更大的大腦容量。
昆蟲與鳥類這兩大飛行物種也啟發(fā)了兩種主流空中機器人導航方法:基于昆蟲反應的和基于鳥類軌跡的規(guī)劃方法。在這兩種方法中,前一種在計算和內(nèi)存方面包含了極其輕量級和高效的解決方案,允許更輕量化的空中機器人集群;而后者顯示了更高的優(yōu)化性和靈活性。為了提高任務效率和可擴展性,高飛的團隊選擇了后者。
在研究各種空中機器人集群應用后,團隊發(fā)現(xiàn)解決“TEEM”難題的關鍵是機器人軌跡時空規(guī)劃,即不僅僅是能夠改變軌跡形狀,還需要調(diào)整時間分布,以最大限度地利用空間。如果僅進行空間變形,空中機器人在通過狹窄通道時,往往會繞行等待其它機器人,這將阻礙后續(xù)空中機器人的飛行,導致飛行軌跡較差甚至不安全。因此,同時規(guī)劃飛行軌跡的形狀和時間,也稱為時空軌跡規(guī)劃,是空中機器人安全高效飛行的關鍵。盡管如此,這種聯(lián)合優(yōu)化對于多旋翼飛行器來說是一個巨大挑戰(zhàn),因為共同確定軌跡的空間和時間參數(shù)是高度耦合的。
“實現(xiàn)聯(lián)合時空軌跡規(guī)劃,保證機器人集群中每一個機器人都能實現(xiàn)軌跡的時空最優(yōu)。這無疑是研究中最為困難的?!备唢w說。
團隊在其提出的方法中,通過解耦目標函數(shù)計算中的時空參數(shù),實現(xiàn)了優(yōu)化變量與表示軌跡的中間變量之間的線性復雜度映射,從而實現(xiàn)了時空優(yōu)化。因此,即使在最受限的環(huán)境中,空中機器人也可以在短短幾毫秒內(nèi)獲得高質(zhì)量的軌跡。
特別地,在團隊的空中機器人集群中,每架空中機器人都具有完整的感知、定位、規(guī)劃和控制功能,并通過廣播網(wǎng)絡共享軌跡從而實現(xiàn)群體協(xié)同。這類似于鳥類能夠在森林中自由飛行,同時避開障礙物和其他移動的生物。例如,在近程導航中,鳥類主要依靠眼睛和前庭系統(tǒng),相應地,團隊開發(fā)了改進的視覺慣性里程計(visual-inertial odometry)。此外,鳥類可以同時調(diào)整路徑和速度以避免碰撞,同時考慮飛行時間和平滑度以節(jié)省能量,因此團隊提出了多目標時空軌跡聯(lián)合優(yōu)化方法。除了具備小型鳥類的能力,團隊還進一步利用了機器人這一人工電子系統(tǒng)的優(yōu)勢,將高保真無線通信用于運動軌跡共享,將高速計算用于快速規(guī)劃。此外,團隊的解決方案滿足了個體智能和群體智能的分布式協(xié)調(diào),提高了系統(tǒng)的魯棒性。
目前,團隊在論文中已經(jīng)發(fā)布了空中機器人集群研究的前沿算法軟件,“開發(fā)人員可以部署和使用這些軟件,從仿真環(huán)境中驗證他們的算法,在未來,這些算法能夠應用在物流小車、機器人配送、野外搜救等領域和環(huán)境。”高飛說。
值得一提的是,在論文中,團隊通過在真實世界的實驗,重點展示了四個具有挑戰(zhàn)性的應用。而就在論文發(fā)表的當天,高飛團隊在國內(nèi)知名視頻網(wǎng)站嗶哩嗶哩上發(fā)布了這四個實驗場景的視頻,截止本文撰寫時,已獲得5.6萬的播放量。
飛越茂密的森林
Challenging wild navigation with bamboos and various other obstacles.
本實驗旨在展示在高度密集的野生環(huán)境,即竹林中,空中機器人集群實現(xiàn)完全自主的群體導航,而不會傷害到機器人本體或植物。圖像中呈現(xiàn)的軌跡顯示了軌跡規(guī)劃的顯著優(yōu)勢:所規(guī)劃的軌跡總是直接而平穩(wěn)地連接一個一個間隙。
在這些環(huán)境中,除了垂直生長的竹子外,還有傾斜的竹子、樹干、低矮的灌木叢、雜草叢生的溝渠、不平的地面、被風吹起的樹葉等障礙物,需要系統(tǒng)對軌跡進行三維規(guī)劃。這種由形狀不規(guī)則、分布密集的障礙物組成的非結(jié)構(gòu)化環(huán)境,驗證了空中機器人集群在大多數(shù)混亂的地方(比如災難場景)導航的能力。
野外的編隊導航
Swarm navigation in formation with prior-unknown obstacles.
該實驗證明了所提出的統(tǒng)一軌跡規(guī)劃的可擴展性。在這里,編隊被定義為保持一個期望的移動形狀,這意味著空中機器人以固定的相對位置移動。與此同時,每架空中機器人還能獨立導航,避開障礙物。本實驗相對于“竹林穿梭”實驗,障礙物密度有所降低,以使編隊清晰可辨,但仍有灌木叢、高低錯落的樹木和兩根人造鐵柱。
按照規(guī)劃的軌跡,空中機器人集群以固定隊形在樹林中飛行。從變形曲線和速度曲線可以看出,盡管空中機器人有時必須偏離路線以避開事先未知的障礙物,但此后會再加快速度以趕上編隊,從而群集仍保持編隊。當空中機器人避開樹木時,平均速度會自動下降,當它們完全回到開放空間時,平均速度會增加。在這種情況下,一些個體的速度變化,在沒有顯式預編程的情況下也能傳播到整個編隊。這一結(jié)果顯示了安全與飛行時間之間的隱性平衡,在障礙物附近減速保留了對潛在碰撞的更多反應時間,而盡可能加速則減少了空曠區(qū)域飛行時間。
密集相互避障評估
Evaluation of intensive reciprocal collision avoidance with unexpected events
這一實驗的設置模擬了摩天大樓之間密集空中交通的最基本要求:安全、高效和獨立導航。為了驗證10架空中機器人的這一能力,試驗者在一個半徑為3米的圓上,將目標位置隨機分配給空中機器人。為了更好地模擬真實的飛行情況, 飛行區(qū)域中除了有茂密的樹干和攝像機的三腳架,還用長方體和圓柱形障礙物模擬新建建筑,空中機器人集群也需要穿過該地區(qū)大型移動障礙物。接下來,實驗者關閉所有地面定位標簽(僅在本實驗中使用),以模擬全球定位的暫時性丟失。
由于安全性和效率是運輸系統(tǒng)的兩個主要關注點,研究者評估了最小碰撞距離和3分鐘飛行中完成交付的總數(shù)量(達到目標總數(shù)),在整個飛行過程中,研究者將每架空中機器人建模為一個半徑為7cm的球體。單架空中機器人設法與障礙物和其他機器人保持安全距離。實驗顯示,到達目標的數(shù)量隨時間的增加而線性增加。實驗結(jié)果表示,在不同障礙物密度下,由于規(guī)劃的軌跡是局部最優(yōu)的,因此可以獲得接近恒定的增長速率。
目標遮擋情況下的空中機器人集群
Multidrone tracking with target occlusion.
這個實驗展示了在微型平臺上添加高計算負荷硬件、以及運行額外任務需求的潛力。集群跟蹤可以用于多視圖航拍和視頻,可以對參與者進行全面的記錄,為后期編輯提供更多的素材。在實驗中,焦點是一個在樹林中移動的人類參與者。為了在避開障礙物和其他空中機器人的同時追蹤目標,實驗設計了跟蹤的約束懲罰來規(guī)劃所需的軌跡。從結(jié)果可以看出,被追蹤人員可以在不需要擔心空中機器人碰撞或跟丟的情況下向前移動。