(CWW)飛行汽車、機器人管家……在一些未來暢想中,今天的人們已經(jīng)擁有了各式“智慧”產(chǎn)品。如果運氣不好的話,高智能機器人大行其道,開始起來反抗人類,再現(xiàn)《機械公敵》劇情。雖然這些想象并未成真,但在當下,人工智能(AI)技術已經(jīng)走進了人們的世界。比如,每當給Alexa智能音箱指令時,機器學習技術都會努力弄清話語內(nèi)容,并試圖做出最佳判斷。每次Netflix或亞馬遜推薦了“下一部電影”或“下一次購貨商品”時,均是基于復雜機器學習算法而定向推薦,讓這些推薦遠比之前的促銷看上去誘人。盡管自動駕駛汽車尚未普及,但人們紛紛意識到自主導航的潛力和趨勢。
【資料圖】
人工智能技術大有前途——它讓機器可以根據(jù)周圍的世界做出決策,像人一樣處理信息,甚至處理方式還會優(yōu)于人類。但是,如果細想上述事例,便會發(fā)現(xiàn)目前的很多人工智能,只能通過“大型機器”來實現(xiàn)——這些機器發(fā)熱量高、擁有線路功耗、體積巨大,而且昂貴。像Alexa和Netflix依靠云端的大型、高耗電服務器來分析用戶的意圖。而自動駕駛汽車則要依賴電池供電,考慮到電池必須能夠驅(qū)動車輪和轉向,因此需要提供很高的容量,與非常昂貴的人工智能決策相比,同樣也要消耗大量能源。
目前,人工智能技術穩(wěn)步發(fā)展,但是人工智能的“小型化,邊緣化”卻明顯滯后。那些由小型電池供電或存在成本和尺寸限制的設備無法實現(xiàn)機器的視覺和聽覺分析功能。目前,這些小型機器只能利用簡單的人工智能技術:也許只是聽一個關鍵詞,或者分析低維信號,比如用光容積描記術(PPG)來測量心率。
如果小型機器有視覺和聽覺功能會怎么樣?
事實上,小型設備一旦能夠看到和聽到,是否有實用價值呢?思考一下,像門鈴攝像頭這樣的小產(chǎn)品需要使用自動駕駛或自然語言處理等高階人工智能技術嗎?似乎也沒有必要。因此可以考慮采用不太復雜、處理強度不大的小型化的、邊緣的人工智能計算,比如詞匯識別、語音識別和圖像分析。
-普通的門鈴攝像頭和消費類安保攝像頭經(jīng)常會被一些無關緊要的事件觸發(fā),比如刮風引起的植物擺動、云彩引起的劇烈光線變化、甚至是狗或貓在攝像頭前跑動。這些事件可能會導致誤觸發(fā),從而需要房主去操作忽視并清除此類觸發(fā)事件。尤其糟糕的是,如果房主正好在世界其它地方旅行,而家里的攝像頭卻對日出、云彩、日落造成的光線變化發(fā)出了誤警報會影響他們睡眠和旅行。但一個智能攝像頭卻能夠基于更具體的事件進行觸發(fā),例如在所監(jiān)控的畫面中出現(xiàn)了一個人。
-門鎖或其它出入口可使用面部識別,甚至是語音識別來授予人員訪問權限,在某些情況下不需要鑰匙或胸卡。
-很多攝像頭都希望在發(fā)生某些特定事件時才觸發(fā):例如,跟蹤攝像頭可能希望在畫面中出現(xiàn)鹿時被觸發(fā),安保攝像頭可能希望在畫面中有人或出現(xiàn)開門或腳步聲等噪音時被觸發(fā),而個人攝像頭可能希望通過語音命令來觸發(fā)。
-雖然有很多“Hey Alexa”這樣的簡單解決方案,但多詞匯量命令在很多應用中都非常有用。如果具備識別20個或更多單詞的詞匯表,就可以在工業(yè)設備、家居自動化、烹飪設備和大量其它設備中應用,以簡化人機交互。
盡管這些例子只觸及表層:讓小型機器看到、聽到和解決過去需要人為干預的問題,但實際上這是一種顛覆性思路,因為人們每天都不斷發(fā)現(xiàn)可智能化創(chuàng)造的新場景。
讓小機器具備視覺和聽覺功能,面臨哪些挑戰(zhàn)?
既然人工智能對小型機器具有如此實用價值,為何沒有被大量開發(fā)呢?答案是受限于算力。人工智能推理是神經(jīng)網(wǎng)絡模型計算的結果??梢园焉窠?jīng)網(wǎng)絡模型看作是大腦處理圖像或聲音的粗略近似形態(tài),將其分解為非常小的片段,然后在這些小碎片組合在一起時識別出模型。現(xiàn)代化視覺問題的主要模型是卷積神經(jīng)網(wǎng)絡(CNN)。這類模型在圖像分析方面非常出色,在音頻分析方面也非常有用。問題在于,這些模型需要數(shù)百萬或數(shù)十億次的數(shù)學計算。對于傳統(tǒng)硬件設計,這些應用在實施時卻會面臨一些困難抉擇:
-使用低成本、低功耗的微控制器解決方案。雖然平均功耗可能很低,但卷積神經(jīng)網(wǎng)絡可能需要幾秒鐘時間來計算,這意味著人工智能推理不是實時的,并會消耗大量的電池電量。
-購置一個昂貴的高性能處理器,能在規(guī)定延遲內(nèi)完成這些數(shù)學運算。不過,這些處理器通常很大,需要很多外部組件,包括散熱器或類似的冷卻組件。好處是,它們執(zhí)行人工智能推理的速度非???。
-低功耗微控制器解決方案的速度太慢,無法發(fā)揮作用,而高性能處理器方法會超出成本、尺寸和電源預算,可以說上述兩種方案都不夠理想,難以實施。
由此可見,人們需要的是一種全新的嵌入式人工智能解決方案,盡可能減少卷積神經(jīng)網(wǎng)絡計算所需的能耗。人工智能推理需要以比傳統(tǒng)微控制器或處理器解決方案更少的能量來執(zhí)行,并且無需借助能耗高、尺寸大、成本大的外部組件(如存儲器)。如果人工智能推理解決方案實際上能夠消除機器視覺的能量損失,那么即便是最小的設備也能看到并識別周圍世界發(fā)生的事情。
幸運的是,人們現(xiàn)在已經(jīng)處于這場“小型機器”革命的開端。目前,ADI已經(jīng)在市場上推出了相關產(chǎn)品,能夠消除人工智能推理的能源成本,并實現(xiàn)電池供電的機器視覺功能。
關鍵詞: 通信世界網(wǎng) 人工智能 邊緣計算