毫末智行技術揭秘 城市NOH何以做到今年落地

發(fā)布時間:2022-04-24 19:31:30  |  來源:騰訊網(wǎng)  

短短三年時間,毫末智行從成立到量產(chǎn),成為發(fā)展速度最快的自動駕駛公司之一,它能在短期內(nèi)迅猛發(fā)展的秘訣是什么?有人說是長城的背書,有人說是AI大牛的支持,而今天我們來說說毫末智行的技術。

今年初,毫末智行的HPilot2.0剛剛搭載到坦克500上,如今HPilot3.0也即將發(fā)布。最近,技術總監(jiān)潘興對外透露了HPilot3.0在技術與數(shù)據(jù)層面的進展和創(chuàng)新。

硬件方面,HPilot3.0擁有360TOPS的算力,也是當前在自動駕駛業(yè)內(nèi)算力最強的一款硬件。全車配備12個攝像頭和2個激光雷達,5個毫米波雷達,12個超聲波雷達。

不用高精地圖 城市道路也能跑

高精地圖就像提前做了踩點的助手,讓你再次走上一條熟悉的道路。有了高精地圖就有了出行的方向,然而,高精地圖也有它的局限性,一方面其制作成本很高,另一方面需要國家審圖通過才能使用,目前還沒有一版完整的城市道路高精地圖在政策許可范圍內(nèi)。

與此同時,對智能駕駛的需求已經(jīng)來勢洶洶,眼下在無高精地圖的情況下去實現(xiàn)更智能化的輔助駕駛勢在必行。

毫末智行HPilot 3.0旨在實現(xiàn)這一想法,主打城市自動駕駛場景。

首先在感知層面。HPilot 3.0能夠提前監(jiān)測到紅綠燈,據(jù)潘博介紹,第一步是識別,第二步是綁路。

由于紅綠燈多樣性的變化,長尾數(shù)據(jù)處理起來較多,毫末智行和大多數(shù)AI公司一樣,采用的是仿真系統(tǒng)。但仿真和現(xiàn)實總會有差距,由此采用“混合遷移學習”來處理和彌合二者的差距。

潘興介紹到,“該學習模型拿到的既有仿真數(shù)據(jù),也有真實數(shù)據(jù)。學完之后,在真實數(shù)據(jù)上的效果是完全可以把仿真數(shù)據(jù)利用起來的。比如在Loss上面增加了兩個數(shù)據(jù)集遷移的距離,通過這種方式學習讓兩種數(shù)據(jù)集的概率分布趨同。

在遷移學習之前,合成數(shù)據(jù)和真實數(shù)據(jù)是分布在各自的維度上。這種情況下學習的效果并不理想。通過混合遷移學習之后,合成數(shù)據(jù)和真實數(shù)據(jù)幾乎就被拉齊了。由此,虛擬的仿真數(shù)據(jù)補進去之后,在真實世界里面它的表現(xiàn)就能自動變好。通過這種方式,能夠快速收斂掉各式各樣的紅綠燈,根據(jù)不同的紅綠燈狀態(tài)完成紅綠燈識別?!?/p>

關于綁路,是為了解決復雜路況、交通指示燈繁多下的識別能力。

“在一條路上無法確認該遵守哪個紅綠燈的情況下,HPilot也是通過一個模型學習的。當輸入一張圖片之后會有一條分支,來處理紅綠燈檢測問題,在圖像上把紅綠燈檢出來。還有另外一個分支,會通過注意力機制,學習出來一個Feature Map,表達該紅綠燈和道路結構的關系。

通常來說,看到一個道路形狀,F(xiàn)eature Map的熱力圖大概率能確認相應的紅綠燈位置,然后再把它們綁定到一起。通過這兩種方法,一個是檢測,一個是通過模型學習場景并綁定,就可以找到該紅綠燈在道路上的拓撲信息?!?/p>

紅綠燈識別只是HPilot3.0的識別能力之一,其通過Transformer大網(wǎng)絡還能解決城市車道線的各種挑戰(zhàn),這些技術使得車輛在城市場景沒有高精地圖的情況下,依舊能提升紅綠燈和車道線的感知能力。

從感知到認知,要想讓車輛像人類司機一樣去做判斷與決策,難度更大,尤其在中國城市道路上存在多重的交互問題。

在諸如環(huán)島、擁擠車流匯入、壓速變道等挑戰(zhàn)面前,毫末智行做成TarsGo Model,通過模型學習和立體化學習的手段,學習人類司機在這些場景下面的動作。

TarsGo提供了車端的模型,需要大量人類的數(shù)據(jù)去訓練。在這方面,毫末智行和阿里達摩院一起基于阿里PAI的框架,共同使用M6大模型,為自動駕駛的數(shù)據(jù)進行了數(shù)據(jù)挖掘。M6不光能夠用在采集車、用戶的車傳回來的這些量產(chǎn)數(shù)據(jù)上,同樣能夠用人類社會每天都在源源不斷產(chǎn)生的生活中的數(shù)據(jù),和其他行業(yè)的數(shù)據(jù),郵戳來迭代自動駕駛的能力。潘興稱,“M6在自動駕駛領域的應用標志著AI模型能力的普惠化”。

獨家MANA智能數(shù)據(jù)體系支撐

無論是感知還是認知,背后支撐的都是大量的數(shù)據(jù),兩個模塊背后正是依托MANA數(shù)據(jù)智能的體系迭代和演進的。

毫末智行開創(chuàng)的MANA數(shù)據(jù)智能的體系在成本與速度上做到了超越。

據(jù)透露,在數(shù)據(jù)標注方面,毫末智行利用自行建立的自動標注能力,相比人工標注可有效降低80%以上的成本,而通常數(shù)據(jù)標注成本就占到了總成本的三分之二,所以這是一筆不菲的支出。只有當標注成本下降了,整個數(shù)據(jù)智能的體系運轉(zhuǎn)才會更加健康。在訓練方面,整個成本下降了62%,加速比提高到了96%。

建立數(shù)據(jù)自行標注能力,在前期是需要投入大量精力的。潘興對車云菌表示,自動駕駛本身是一個數(shù)據(jù)密集且對數(shù)據(jù)的標注質(zhì)量要求很高,所以數(shù)據(jù)標注是核心競爭力的體現(xiàn)。

為此,毫末智行也專門組建了單獨的數(shù)據(jù)自動標注的算法團隊、工程團隊。“標注要求比感知更嚴格,2D的像素上可能就要3個像素以內(nèi)能框得出來,3D上可能就是幾厘米的誤差,這個框要足夠準。而且自動駕駛不光是要框出這個物體,對這個物體的屬性要求還很高,這個物體是被遮擋還是截斷,是在地面上還是馬路上,是騎自行車還是騎摩托,是三輪摩托還是老頭樂,這些都要有一個明確的語義標注。所以在2D、3D以及屬性的標注上,我們都是經(jīng)過了很大優(yōu)化的工作量?!迸伺d稱。

因此,MANA數(shù)據(jù)體系在成本和速度上為毫末智行后續(xù)的產(chǎn)品研發(fā)與落地提供了很強的便利性,使得城市NOH功能今年即可落地。

相比于同業(yè)公司的城市輔助駕駛功能落地進度,毫末智行搶在了領先的位置。在高速道路布局輔助駕駛的能力已經(jīng)基本實現(xiàn)后,主戰(zhàn)場轉(zhuǎn)移到了城市場景。

在潘興看來,毫末智行之所以能率先落地,其一是采用重感知的方案。當其他同行還在研發(fā)的階段,他們就可以在大規(guī)模的城市部署,用戶可以使用。如果是重地圖的方案,城市高精地圖會受到限制。毫末智行城市NOH今年6月份SOP,并可以做到全國100多個城市有效的部署,所以在范圍上具有很大優(yōu)勢。

其二是搭載在長城大體量車型上。整體部署范圍大、車型多、數(shù)量多,我們基于更多的數(shù)據(jù),持續(xù)迭代的速度也是競爭優(yōu)勢之一。

車云小結

自動駕駛從高速席卷到城市內(nèi),面臨的技術難題遠比大眾看到的多,繼續(xù)解決和普及自動駕駛依舊任重道遠。毫末智行董事長張凱提到的“三大戰(zhàn)役”——“數(shù)據(jù)智能技術之戰(zhàn)”、“智能駕駛城市場景之戰(zhàn)”、“末端物流自動配送車的規(guī)模之戰(zhàn)”何嘗不是整個自動駕駛行業(yè)的戰(zhàn)役。

關鍵詞: 毫末智行技術揭秘 城市NOH何以做到今年落地 毫末智行

 

網(wǎng)站介紹  |  版權說明  |  聯(lián)系我們  |  網(wǎng)站地圖 

星際派備案號:京ICP備2022016840號-16 營業(yè)執(zhí)照公示信息版權所有 郵箱聯(lián)系:920 891 263@qq.com