雷鋒網按:2020 年 8 月 7 日,全球人工智能和機器人峯會(CCF-GAIR 2020)正式開幕。CCF-GAIR 2020 峯會由中國計算機學會(CCF)主辦,香港中文大學(深圳)、雷鋒網(公眾號:雷鋒網)聯合承辦,鵬城實驗室、深圳市人工智能與機器人研究院協辦。
作為中國國內最具影響力和前瞻性的前沿科技活動,CCF-GAIR 大會已經度過了四次精彩而又輝煌的歷程。CCF-GAIR 2020 延續了過去的強大陣容,提供了 15 個專場(人工智能前沿專場、機器人前沿專場、智能駕駛專場、AIoT 專場、AI 芯片專場、視覺智能·城市物聯專場、AI 源創專場、AI+ 藝術專場、企業服務專場、工業互聯網專場、AI 金融專場、醫療科技專場、智慧城市專場、聯邦學習與大數據隱私專場、前沿語音技術專場)。
在智能駕駛專場,全球MIT TR35獲獎者,人工智能頂尖期刊IEEE TPAMI編委,ICCV/CVPR/ECCV領域主席、阿里自動駕駛實驗室主任王剛帶來了《面向末端物流的無人駕駛技術》的主題演講。
目前阿里巴巴致力於物流行業的無人駕駛,包括最後3公里的末端物流和城市公開道路的配送。
王剛在會上表示,末端物流場景看似簡單,但實際上並不容易。首先相對城市道路,末端道路的非結構化更嚴重;其次末端物流在產品落地上的成本也要考慮;三是產品的系統應該在全天候、不同條件下都能做到穩定,這些都是挑戰。
因此,在算法的智能上,阿里提出了“小前台,大中台”的概念,希望打造一個用計算驅動、數據驅動的賦能組織,讓算法減少對人工設計的依賴。
在硬件層面,阿里也在傳感器和計算平台上下功夫,打造專門自動駕駛、無人物流設計的硬件。
在系統架構層面,王剛認為自動駕駛系統要具有穩定性,可以利用遠程人際共駕等方式來實現安全冗餘。
以下是王剛的演講全文,雷鋒網新智駕進行了不改變原意的編輯:
大家好,我是王剛,非常榮幸跟大家分享阿里巴巴在自動駕駛上的思考和實踐。阿里的自動駕駛定位和使命,跟其他很多公司不太一樣。大家談論的自動駕駛很多與RoboTaxi、高級輔助駕駛有關,但阿里致力於物流行業的無人駕駛。
用三個短語來概括阿里做自動駕駛的原因:業務有需要、社會有需求、機會有希望。
阿里擁有全球最大的物流需求體量和最豐富的場景,從電商菜鳥、同城零售、到本地生活,每天有數億的快遞、外賣、零售單需要被配送到消費者手裏。自動駕駛物流並非是要在阿里內部創造新的賽道,相反,它是阿里生態非常自然的延伸,能夠跟內部業務形成配合。利用業務作為牽引,場景作為驅動,帶動阿里自動駕駛技術的提升。
阿里解決的不只是內部問題,同時解決的也是社會問題。未來人口的老齡化肯定會帶來衝擊。有一個預測是,未來每天的快遞將會達到十億單的規模,如果不能實現智能化,物流行業將無法承載這樣巨大的單量運輸。
目前在物流行業,阿里專注於兩方面:
首先是末端配送,末端指的是最後3公里,包括園區、社區、校園等場景。同時阿里也關注在城市公開道路的配送,滿足物流、同城零售的需求。
目前公開道路上的自動駕駛還處於探索或者研發階段。我覺得挑戰在於,自動駕駛系統不知道自己不知道什麼。人工智能是一門實驗學科,基於數據驅動,本質上是從範例中學習。但於自動駕駛車輛而言,很多場景是沒見過的,系統不知道自己不知道什麼。所以公開道路的無人駕駛,需要更多針對公開道路的研發。
末端物流這塊也有很大的需求,關鍵在於成本。如果成本不高,為什麼不享受自動化的服務?末端落地上會帶來很多便利。跟公開道路不一樣的是,末端自動駕駛物流系統只要知道自己知道什麼就可以了。因為末端道路的速度、周圍參與者的速度都比較慢,遇到不確定的情況,可以用系統化的手段解決。也就是説,並不要求解決所有場景的問題,只需要解決頭部比較確定性的問題。
我們可以重新定義自動駕駛,對系統進行正向開發,讓每個模塊確定自己到底知道什麼、瞭解模塊之間的配合。通過思維方式的轉變,我認為在未來幾年裏,低速無人車必然會帶來產品化、規模化和落地。
我們的末端運營走得比較前,一年多前就已經在校園、社區、園區三個場景開始真實的物流配送。不只是Demo或者玩具,它每天為數千個消費者帶來了便利。“雙11”的時候我們的無人車每天可以送3000單。
最初我們認為,比較大、比較重的包裹才有無人配送的需求,但最後發現即便是很小的快遞,用户也有讓無人車送上門的需求。科技的發展,讓我們把更多的時間花在開心的事情上,而不是在烈日之下取快遞。
末端自動駕駛物流的技術要求
從技術來看,相對於公開道路,末端物流有很大的便利,但它不是很簡單的事情,還是很多約束。
一是智能。雖然相對城市道路,末端物流的道路速度沒這麼快,但它的非結構化程度更嚴重,包括路樁、人車混流等。我們將Waymo自動駕駛記錄和我們的自動駕駛記錄進行了一個調研,在什麼情況下無人車需要做橫向決策或變動。我們的末端車輛大概比Waymo多20-30倍,假如Waymo一公里做一次,我們的車一公里要做二三十次橫向決策。從另一個維度來講,它是更有挑戰的事情,要求我們的無人物流車在複雜環境下能夠做到穿梭如飛。
二是成本。公開道路上的測試不考慮成本問題,因為還是科學研究,沒面向業務和產品。但末端物流不一樣,其產品化的腳步越來越近,我們要切實考慮它能創造多少收益,成本支出限制是什麼?成本十幾萬的一輛車肯定養不活自己。這跟公開道路的無人車是兩個不同的課題。
三是穩定。無人車的系統如何做到7*24小時,在不同天氣、不同環境下實現穩定可靠的運輸?如果無人車成為業務和產品,它必須隨時在崗。這個問題的解決不要拘泥於算法的解決,自動駕駛處於一個大的物流系統,很多的單點問題如果從算法來解決,是永遠解決不完的。我們要考慮如何用系統的力量、產品的設計,讓業務運行起來。
所以在系統的設計、鏈路的打通上,阿里做了非常多的事情。今天我想談談在算法上、技術上阿里做了什麼事情。
智能化。我們希望這輛車很智能,可以處理不同的情況、不同的場景,可以穿梭如飛。跟其他公司一樣的是,我們也做感知、定位、決策、控制,但不太一樣的地方在於,我們提出了“小前台,大中台”的想法。
我們認為感知、定位、決策、控制四個模塊是人工智能算法模塊,本質上需要底層的驅動。很多人都在説人工智能,但我認為應該叫計算智能。人工智能的意思是像人一樣智能,但這是不靠譜的。我們想要造一架飛機,不可能像鳥一樣做鐵翅膀,這不是一個正確的思路。我們更多要用計算機的特點,從數據、計算上找到智能的來源,所以應該叫計算智能。
“小前台,大中台”本質上是希望打造一個計算驅動、數據驅動的賦能組織,讓不同算法可以減少對人工設計的依賴。因為人工設計本質上是將自己的知識轉化為智能,但人的理解非常膚淺,很難理解圖像、激光雷達在高維空間裏的表達。過去十幾年,機器學習、人工智能的發展本質上遵循一個規律,人的設計是不靠譜的,我們要用計算、自動化方式替代人工設計,從而帶來提升。
最初,我們分類器是規則分類。我們發現人工設計的特徵很明顯,所以用深度學習替代人工設計,變成自動化學習的特徵。
第二是傳感器、計算平台等硬件。人工智能的發展,是計算代替人工設計的過程。即便到了今天,我們發現感知、定位、決策、控制這些模塊裏還有大量的人工設計。這些設計不但降低開發效率,需要很多工程師投入,同時嚴重降低整個模塊的質量。我們希望通過計算智能的方式解決。在硬件上,我們做了非常多的事情,以減少硬件成本,同時帶來功耗降低。在定位模塊、傳感器模塊,我們根據算法需求往下做得更深。因為現在很多硬件不是為自動駕駛、無人物流車輛設計的,這些設計要麼過於冗餘,要麼達不到需求,我們必須往下做,做得越來越深。
第三是集成系統,系統要保障穩定性。千萬不要讓所有的問題都交給自動駕駛來解決。我們想做的是面向客户的產品,很多時候可以用系統化的方法。遠程人機共駕,就是一個非常好的案例。無人駕駛物流車的好處是低速,可以隨時停下,呼叫遠程控制中心。未來只要把人工成本降到足夠低,可以實現讓1個人看100輛車甚至1000輛車。
我們希望建立計算中台,賦能所有的算法,減少人工設計。這跟自主機器學習有點類似,在過去的實踐裏,大家做的任務比較簡單,比如文字識別、圖像識別,主要搜索的是感知網絡結構、超參數,這是有限制的。但在我們的AutoDrive平台裏,我們進行了擴展,可以支持全鏈路需要,支持感知、規劃、定位、控制。
同時為了支持全鏈路,我們做了非常多工程上的工作,一個典型案例是仿真。比如學習決策規劃算法,這不是一個簡單的圖像識別問題。這條路徑開得好不好,能否滿足要求?包括評價機制、仿真機制,都是非常難的工作。這方面我們搭建了一個比較完善的平台,支持整個鏈路的學習。
基於這個平台,我們所有算法工程師都可以把很多需要人工設計的內容交給平台。
在實踐落地上,我們也有收穫一些成果,比如紅綠燈識別。我們在AutoDrive平台上搜索出來的結構不僅效果更好,更重要的是,其計算、結構相對來説簡單非常多。
這很容易理解。因為工程師在做網絡設計時的首要想法是保障效果,為了效果他會把各種結構累加上去,從而帶來效果提升。但裏面可能有很多冗餘,而工程師不知道。所以人的理解是非常侷限的,很難穿透網絡結構,直觀理解發生了什麼事情。而通過數據驅動的方式,可以把系統裏面冗餘的結構去掉,找到核心的表達。
除了感知外,我們也把平台用在決策規劃裏。末端場景車輛跟人的交互非常重要,一個決策非常謹慎的車在末端場景裏是寸步難行的。如果把它設計得非常簡單,可能會出現車輛撞人的情況。那麼到底哪種是比較好的狀態?靠人的理解是很難做到的,所以通過自動化的方式可以找到比較好的權衡。
此外,在實踐上,我們做了一些別的實踐,比如車載ISP。目前車載領域滿足夜視需求的產品不是非常多。所以我們做了一些簡單的實驗,讓ISP在弱光環境下表現更好。新的ISP相對於業界標準方案,對算法的幫助非常大。
從這一點來看,自動駕駛最後的發展必然是越來越偏向於軟硬件一體化。硬件如何為軟件服務,軟件如何定義硬件,這必須是一起考慮的事情。
此外,我們還做了高精定位低成本方案。如果用大廠的定位方案,一套系統可能要十幾萬,非常昂貴,這樣系統是無法支撐車輛的產品化的。所以我們將定位系統的成本做得非常小,其實際運行也非常穩定。
在Demo展示中,可以看到,兩個礦泉水瓶間隔1米,阿里的無人駕駛物流車寬95釐米,即左右兩邊留下共5釐米的空間。我們的定位方案進行了上百次測試,實現了非常穩定地精確定位。
最後是系統部分。我們的系統有多重安全保證的設計,因為保證安全是無人車運行的基石,是底線。我們的被動安全設計包括遠程監控、人機共駕等,這是系統必需的部分。
(雷鋒網) 雷鋒網