楠木軒

大道智創龍建睿:機器人導航技術的通用平台和垂直場景 | CCF-GAIR 2020

由 鹹春葉 發佈於 科技

      

8月7日-8月9日,2020年全球人工智能和機器人峯會(簡稱“CCF-GAIR 2020”)在深圳如期舉辦!CCF-GAIR由中國計算機學會(CCF)主辦,香港中文大學(深圳)、雷鋒網聯合承辦,鵬城實驗室、深圳市人工智能與機器人研究院協辦,以“AI新基建 產業新機遇”為大會主題,致力打造國內人工智能和機器人領域規模最大、規格最高、跨界最廣的學術、工業和投資領域盛會。

8月8日上午,在「機器人前沿專場」上,大道智創聯合創始人龍建睿博士進行了題為「機器人導航技術的通用平台和垂直場景」的演講。

      

龍建睿是伊利諾伊理工大學博士,哈爾濱工業大學本科。2015年開始負責機器人自主移動系統的研發,專精於視覺/激光SLAM算法、導航與控制算法和多傳感器系統架構,致力於通用場景下可靠、輕便、零部署overhead的技術方案。持續在安防、智能工業/農業、清潔防疫、物流配送和信息分發等各種場景下探索低速無人駕駛技術的商用可能,主導推進的e巡安防巡邏機器人、DDR移動零售機器人、防疫機器人、移動信息發佈機器人和CS一體化智能牧場機器人等產品目前已成功落地,並具有完全自主知識產權。

大道智創是一家專注於研發安保機器人的公司,主要研發和銷售巡邏機器人、安保機器人等商用服務型機器人,以視覺定位為主,配合多傳感器融合,在複雜環境下實現全自主定位巡航。

以下是龍建睿博士在大會的演講實錄,雷鋒網作了不修改原意的整理和編輯:

大家好,我的分享主要圍繞機器人導航技術展開,從通用平台和垂直場景兩個角度去理解,以及提供我本人的一些判斷。

機器人“動”起來

這次講的主要是移動服務機器人而不是工業機器人,因為那不是我們的專長。此外,我們希望機器人能“動”起來,能為我們提供處理問題的服務,因此也不講固定機器人。在過去幾年,我們看到很多機器人在不同的場景服務人類,但服務侷限於交互服務,如人臉識別、語音識別、對話、迎賓等。相反,我們探索的是機器的自主運動服務。因為人類一個非常重要的功能就是行走,要在物理世界互動。機器人需要扮演的是一個跟物理世界互動的角色。張宏院士提到定位導航,即我在哪,機器人需要知道我在哪,然後知道自己要去哪,因為這是它能夠開展服務的一個核心。但是我們先不談“我是誰”,因為這是強人工智能的問題,這是終極機器人的答案,我們現在暫時無法回答。接下來我會提供一些自己的想法,即我們認為它有什麼、猜測它會變成什麼樣,但是我們不能斷言它具體是什麼樣子的。

服務機器人行業的市場規模大概如下:

如上圖所示,全球服務機器人的規模是100億美元左右,而且還在快速增長,中國在全球的佔比也是不斷增長,速度加快,但最關鍵的一點是,服務機器人正圍繞着“我在哪”和“我要去哪”這兩個核心問題發展出了一系列應用。

現在已經有很多基於傳統AGV的新應用出現,比如商用清潔、配送、安全巡邏、現代農業等(如下圖):

      

上圖展示了機器人在許多場景下的應用。

最左邊的三張圖是相對傳統的行業應用,如搬運機器人,如變電站與核電場內的巡檢機器人。以及左下角是現代農業的自動化推料機器人。這三張圖跟其他應用的不同之處在於:左邊的場景離我們的生活稍微有點遠,我們並不用每天去倉庫,可能也被禁止進入核電站。右邊這三列詮釋了近幾年的應用變化。服務機器人進入這些環境,已經是跟我們進行零距離接觸了。我們家裏可能會用小小的掃地機器人幫我們掃地,在商場會看到商用清潔機器人為大環境進行清潔,也看到一些零售服務機器人和信息廣告分發機器人,它們能在商場或更大的環境裏自主運行。相信很多人也見過送餐機器人,它可以讓繁忙和需要人力的行業慢慢變得高效。右邊三樣是室外機器人的應用,如物流配送機器人、巡邏機器人、零售機器人。

服務機器人的應用場景越來越豐富,所處環境的變化越來越多,而人類能對它進行的改造其實越來越少。怎樣才能打造這麼一些系統呢?我們相信真正有效率的辦法是找到這些機器人的共性,平台化,讓它擴展。

上圖頂部的場景就像是一棵樹的枝,底下是我們想到的通用的平台和模塊。一個機器人系統可能有非常多這樣的模塊,那麼它們之間有哪些共性呢?我們應該怎麼看待每一個模塊呢?它們是更容易通用化的東西,還是需要非常多細緻的定製呢?接下來做一些簡單的介紹。


1. 運動平台

      

首先,移動服務機器人肯定有一個運動平台,涉及到“海陸空”三軍。我們看到天上飛的、水裏遊的、地上走的,似乎都有兩種模式、能跨越各種地形的足式的機器人。如果我們是一個小小的愛好者,或者是小小的創業公司,要做產品,需不需要從頭開始搭建一個機器人品牌呢?不需要。我們可以去找通用的平台。

目前看起來,許多工作已經開始往平台化、通用化的方向努力了。比如智能駕駛汽車,裏面線控與其他部件的標準已經非常固定、非常成熟。那是否意味着運動平台作為運動機器人的核心已經固定地通用化了呢?其實不是,因為我們看到機器人的一切服務都是在場景當中,運動平台自然是要為場景服務,我們沒有辦法讓輪式機器人到天上去巡邏、去追蹤,也沒有辦法把一個無人機放在海里面。

比方説,最左邊的兩個機器人都可以運動,都是駛輪式的,控制可能也都比較簡單,可以原地旋轉。但是我們可不可以在室內使用坦克一樣強壯的機器人呢?理論上是可以,但是它的預算、功耗、對環境的干擾和影響有可能是災難性的。所以我們在高端的寫字樓裏應該不會看到這麼強壯的機器人。或者説,如果要在小區裏、公路上、開放道路上做巡邏,我們可不可以用左上角的機器人呢?好像也不可以。這就造成一個問題:好像就連這麼一個簡單的運動平台,也沒有辦法完全通用化,而更多是一定要根據場景進行選擇。

       

 上圖所示是一些比較傳統的定位導航設備,如輪子里程計、慣性測量單元和GPS。相對於前面的環節來説,它的通用性會更好一點。但是,如果我們要做機器人服務的產品,那些這些東西的選擇一樣是有非常多的考量,比如製造的成本、性能和成本的平衡。

接下來這幾類傳感器是近幾年比較熱門的:

      

 激光雷達可以直接探測周圍環境物體的位置和距離。右邊的攝像頭看起來很不起眼,但擅長追蹤物體和環境的紋理信息。這兩種類型的傳感器最大的特點是信息量非常巨大,可以提供各種各樣的冗餘。好像這樣的傳感器配上開元算法是不是就解決了導航所有的問題呢?是不是就可以判斷它是通用呢?其實不是。

我們看左邊的激光雷達。提到“激光雷達”,大家認為具體是指什麼樣的雷達呢?是平面雷達還是360度的3D雷達?如果是3D雷達,又是多少線的?還是那個不怕振動但是視場角有限的MEMS雷達?你要的雷達是美國人生產的還是中國人生產的?需要的是第幾代雷達?這是一系列非常細緻的問題。即使確定了這些,我們也會發現後面有一些跟算法緊密相關的問題。

視覺則更復雜。單個攝像頭可能看起來簡單一點,但是引入立體視覺(機器人系統中非常常見的設備)之後,就有非常多具體的問題,比如分辨率、精度、曝光時間。像立體視覺還有基線的問題,基線長的話可能探測的時間越長、越遠,甚至還有一些混搭的玩法,比如右下角360度的魚眼的全景攝像頭能不能跟其他傳統攝像頭進行配合?這一系列的東西聽起來更像是為了場景設計出來的部件,而不是通用的部件。由於激光雷達和視覺系統的誤差、模型、定位的精度不同,而且又有一些互補,所以現在出現了第三類的、介於兩者中間的混合型產品(如RGBD相機),可以同時提供紋理和比較精確的深度。有些創業公司把激光雷達和一個或多個攝像頭配合在一起,通過非常高級的算法和定製化的芯片直接計算出非常長距離的、非常高精度的深度信息和RGBD信息。這裏列出來的設備範圍有限,但是我們看到過這樣的創業公司會做出非常遠距離的深度相機。這些都是優化的方向。那它們之間有沒有通用呢?有沒有共性呢?有,但還是以場景導向為主。

 

2. 計算平台

接下來講到較有通用性的計算平台。從嵌入式到PC,再到汽車上使用的自動駕駛器和超級計算機。我們也希望這些東西是機器人系統裏面最容易被通用化、最容易被廣泛推廣的。

      

 下面是定位導航的核心軟件。我們做機器人導航與算法優化經常會聽到客户、投資人、愛好者或其他人問的一個問題:這些東西不都是開源了嗎?這些東西都已經是造好的輪子,你們為什麼要自己去開發呢?

       

我講幾個簡單的對比。現代的數學其實是幾百年前就已經開源了,那我們能夠用幾百年前的數學做出機器人或者人臉識別的機器嗎?不能。數學就像一個萬能的輪子,但是你要把這個輪子打造成自己想要的樣子。這裏就是我們做定位導航和算法優化要考量的地方。首先是開源還是閉源?其實沒有軟件可以完全不依賴於開源,或者只依賴於開源。它一定存在非常多定製化和場景適配的問題。從開源到閉源,中間的平衡掌握恰好是一個機器人公司,特別是做底層技術機器人公司真正有價值的地方。在這個探索的過程當中形成對場景、場景配置和模塊組合的理解,還有對從業者本身優秀的直覺。這些理解的價值遠遠大於產生酷炫好看的demo。

另一個問題是:可配置化和可替換組件是一種好的方式嗎?還是用一體化和傻瓜化的東西?這裏我想舉兩個例子。如果有一把瑞士軍刀,現在伸出來是螺絲刀,但是我希望它馬上變成開瓶器。我想這個是非常容易的,只需要把另外一邊拔起來。它是一個可配置化的產品,也是一個可以替換的組件。但我們賣給用户的一定是這樣的東西嗎?再舉個例子:最近有一種比較火的化學物質叫硝酸銨,它可以配置成高效率的氮肥,也可以配置成非常兇猛的炸彈。那我們要把這麼一種東西交到用户手上嗎?這一切都非常依賴於你對產品的定義、對產品使用場景的限制,還有中間缺失的某一種運營的環節。

還有一個問題是:端上的功能還是雲上的功能?這涉及到算力分配。我想這以後慢慢會變成協同,但是協同的界限在哪裏?哪些東西是需要實時、馬上、立刻、快速處理的?而哪些東西可計算量不大,不用佔據我太多資源,我也不着急用的,我也可以慢慢交給雲?隨着通信系統的變化,界限也會慢慢推移。

 

3. 環境改造

環境改造是機器人行業關注的又一個話題。人類在適應環境的過程當中學會了改造環境,這是人類與其他動物不同的地方。人類不會認為什麼都不穿,就靠人的肉體的改變就能適應從南極到北極再到赤道的不同温度。我們是把環境按照人類自己的需求進行改造的。為什麼機器人不可以呢?其實機器人已經在享受這樣的好處了。比如説火車,説起來好像跟機器人沒有關係,但是火車配備了各種各樣的自動化系統,已經不是完全依靠人在開了。接下來是改造鋪裝道路的問題。原來的鋪裝道路改造只把限越野車開的地方改成小汽車和電動車都能輕易行動的地方,但在未來,車聯網和智慧城市的概念會對環境進一步改造,使環境更適合機器人。

             

未來的改造也會越來越友好化,沒有那麼有侵略性。就像GPS,它是不是改造了環境呢?答案是肯定的。它的衞星分佈在天上,對我們的生活影響沒有那麼直接,這就是非侵略性的改造。我們看到的倉庫環境,甚至一開始都不能叫改造,而是建設,用二維碼、視覺特徵和電磁特徵來引導和定位。上圖最下面一行中間偏左的圖是很多年前的送餐機器人,腳下是有軌道的,這是對環境的改造。為什麼呢?因為如果不做這樣的改造,那時候的技術很難讓它穩定的定位運行。現在環境增強需要對環境改造到什麼強度呢?我們在房頂裝幾個小小的地面站,或者是在天花板上裝一個視覺特徵。這個視覺特徵甚至是紅外的,人類肉眼看不清。人類潤物細無聲地改變環境,讓環境保持對人友好的同時,也對機器人更友好。我們的初心是製造有用的、零部署的、不需要改造環境的機器人。但我們目前還沒有辦法保證完全不改動環境就能讓機器人運行。右下角顯示的是門禁和梯控機器人的場景,這些場景也需要簡單改變環境,但是沒有那麼有侵略性。

             

上圖所示的協同調度系統適用於大規模的機器人,能使無人機跳舞,管理運輸機器人,協同多個機器人同時完成多個任務,或是控制無人車隊。這些運營努力是建立在對場景的理解和軟硬件的基礎設施上。

關於通用還是垂直,我們有幾個比較粗淺的判斷:

第一,垂直應用仍然是機器人行業(尤其是服務機器人行業)的主流和驅動力。我們不可能在脱離場景的前提下去談酷炫的算法、開源和取代。

第二,機器人產業的鏈條會變得更長,具有更多的環節,每個環節本身內部可能出現比較多的通用性。比如前面所説的慣性導航元件於GPS接收器,這些已經開始在內部通用化,接口非常標準一致。它聚焦的是更小的地方,像一個鏈條越來越長,每個鏈條上的東西越來越漂亮,越來越牢不可破。

第三,場景會更加協議化,環境改造會對機器人更友好。場景改造會藉助新基建和智慧城市的努力而使服務機器人的市場更加繁榮。

第四,機器人的應用運營會越來越重要。什麼是應用?我們發現,學界或產業界向終端客户推廣產品時,他們好像有各種各樣的不情願。我想不是因為威脅到了他們的工作,而是產品使用很麻煩。在機器人解決強人工智能的問題之前,終端用户可能不願意用機器人產品。哪怕點一下鼠標、按一下開關,都是增加他的工作量。如果好處還不足夠大,給他們增加簡單重複的工作更沒有意義。這時候,我們猜測中間可能會出現一個類似於手機用户和華為、中興設備生產商中間的運營商。


影響因素

但上述判斷也會受到一些重要因素的影響:

1.  通信技術

             

新一代通信技術帶來最直接的衝擊之一就是機器人部署方式的革命。我們以前推廣的機器人需要巡邏,需要在場景裏面做構圖。在這些步驟完全自動化之前,誰來完成呢?其實是我們自己在完成,因為終端客户是不願意配合你做這個事情的,他們覺得很麻煩。那我們的人是不是需要到物理世界進行復雜的部署和後續的維護?但是如果有了更快、更可靠、更低延時的通信手段,就可以像上圖這位大哥一樣,坐在幾個屏幕面前遙控汽車和機器人,遙控進行對機器人的維護。

第二點是混合智能,即人和機器結合的智能。機器人不可能百分之百穩定地工作。那麼機器人不穩定的時候,誰來維護?我們可以通過遠程可靠的通信網絡來解決機器自己沒辦法解決的問題。

這又涉及到雲計算的問題,它可以抹平算力上的差別。另一個是人工智能技術,比如語義SLAM技術。語義SLAM技術不再將場景理解為簡單的點雲、像素、紋理,而是理解為物體及物體本身的性質,如物體可不可以移動、是長久存在還是臨時存在、會不會發生光照變化、會不會發生體積變化(像一棵樹)。這些都是AI比傳統的幾何SLAM更擅長做的事。這也會帶來更強的物理互動。還有一點系統本身的複雜化、非線性、強非線性甚至是混沌效應。傳統的手工設計的方法可能已經不是很適合應對這些問題。那怎麼辦呢?通過強化學習、深度學習,讓機器人自己跟環境互動、學習。

2.  新基建和智慧城市

新基建與智慧城市會讓機器人和人都在更友好的環境下行動。機器人進電梯就是在實際生活中會遇到的問題。每一家電梯都有協議,且電梯作為一個非常重要的安全設備,不能隨便Hack進去,這是被禁止的。那麼,誰有能力來推進標準的統一,使得一個機器人在一部電梯上行動之後,就可以在另一些電梯上行動呢?那一定是業界、政府、學界的共同努力。在未來的智慧環境中,機器人還可以扮演其他角色,比如數據採集者和治理的執行者。

3.  Covid-19和公共衞生方面的挑戰

今年疫情下,每一家公司都説自己能做防疫機器人,噴藥、紫外線殺毒、探測人體温度、發燒識別等等。我們能從中得到什麼啓示呢?在處理重大公共衞生問題時,可以讓機器人選配功能,裝什麼能消毒、裝什麼能識別温度,然後慢慢變成標配。服務機器人作為公共衞生產品是必要還是蹭熱點?這仰賴於產品設計和運行。

4.  國際政治的挑戰

機器人在物理場景行動,可以採集很多信息,所裝載的數據會因為政治原因變得更敏感,需求也更分化,網絡安全問題也會成為焦點。對底層的開發人員來説,算法的開源和核心器件的生產和銷售也都面臨着政治化的挑戰。我們看不到紅線在哪裏,機器人運營也備受挑戰。


服務機器人的未來

             

服務機器人首先要對場景有一個非常垂直的理解,包括對場景的定位、導航、服務、後台的連接、客户的交互,打通各個環節。然後走創業的方向,現在的方向主要是在機器人配送和機器人清潔兩方面。雷鋒網

其次可以做系統適配和平台化。就是用自己的技術做機器人,配合合作方推向市場。但是,我們就不再花大力氣做具體的運營和落地。雷鋒網

還有一個方向是製造關鍵設備,比如智能駕駛、智能芯片、定位導航的模組。這個方向對技術研發要求非常高。

最後是機器人運營商。這也是非常關鍵的合作方。它的存在既加速機器人的落地推廣和反饋推進機器人的迭代,也方便終端客户和普通大眾接收和享受機器人給我們生活帶來的實際便利。雷鋒網