【CSDN 編者按】美國加州大學伯克利分校的研究人員製作的機器狗,無需在計算機模擬仿真中進行訓練,而直接在現實世界中,利用人工智能大腦在一個小時內從晃晃悠悠翻身都困難到行動自如即使被推倒也能迅速翻身站立起來完成了巨大的轉變。
原文鏈接:https://singularityhub.com/2022/08/08/this-robot-dog-has-an-ai-brain-and-taught-itself-to-walk-in-just-an-hour/聲明:本文為CSDN翻譯,轉載請註明來源。作者 | Jason Dorrier 譯者 | 陳甜靜 責編 | 屠敏出品 | CSDN(ID:CSDNnews)自學走路機器狗
哺乳動物出生後都會經歷努力爬起來,跌倒,站立,然後再次跌倒的情況。但令人驚訝的是,在經過了這不熟練的大概十幾分鍾初始期後,動物們都會熟練地使用四肢做出日常跳躍等動作了。加州大學伯克利分校丹尼爾·哈夫納(Danijar Hafner)和同事們研製出的一隻機器狗很特別,它沒有通過事先設定好的程序執行任務,完全是通過自學學會了翻身以及走路。圖源:Danijar Hafner / YouTube
剛開始它先是仰卧在地上雙腿不斷擺動,試圖想要翻過身來,經過不斷嘗試終於在十分鐘的時候學會了翻過身變成俯趴在地上,在二十分鐘的時候試圖嘗試站立起來,在三十分鐘的時候已經站立起來但是卻有些踉蹌,在四十分鐘的時候開始嘗試着行走,但是四肢卻有些不受控制。終於在一個小時後,機器狗已經可以熟練控制四肢往前行走。使用一卷紙板作為障礙物,用來試探機器狗的行動路線,沒想到僅在十分鐘之後,機器狗就學會了如何在障礙物的阻擋下重新翻身站立起來往前走。圖源:Danijar Hafner / YouTube
這不是機器人第一次使用人工智能來學習走路。但是,雖然以前的機器人通過無數次模擬迭代中的反覆試驗來學習這項技能,但這款機器狗完全是在現實世界中學習的。圖源:Danijar Hafner / YouTube
在arXiv上發表的一篇論文中,研究人員Danijar Hafner、Alejandro Escontrela和Philipp Wu表示,將在模擬中學到的算法轉移到現實世界並不簡單。有下面兩個原因:現實世界和模擬之間的小細節和差異可能會絆倒初出茅廬的機器人。在現實世界中訓練算法是不切實際的:它會花費太多時間,並且對機器人產生磨損。Dactyl機械手
例如,四年前,OpenAI展示了一種可以操縱立方體的人工智能機械手—Dactyl機械手,它是通過機器自主學習無須太長時間,就可以通過機器自主學習的訓練和基於特定的編碼,實現了單手解魔方的玩法。訓練和專門的編程,實現了單手解魔方。它使用了最新被稱作強化學習的AI算法,但純粹的強化學習算法需要很多反覆試驗學習技能,以便在現實世界中進行訓練。圖源:YouTube
Dreamer算法
來自伯克利團隊使用一種名為Dreamer的算法來解決這個問題。構建“世界模型”,Dreamer算法可以預測未來行動將實現其目標的概率。隨着經驗的積累,其預測的準確性會提高。通過提前過濾掉不太成功的動作,世界模型可以讓機器人更快地找出什麼是有效的。研究人員稱從過去的經驗中學習世界模型使機器人能夠想象潛在行動的未來結果,減少試錯次數。換句話説,世界模型可以將模擬中相當於數年的訓練時間減少到不超過現實世界中的一小時。該團隊還將Dreamer算法應用於拾放機械臂和輪式機器人。在這兩種情況下,他們發現Dreamer可以讓他們的機器人能夠有效地學習相關技能,而無需模擬時間。可能在未來還會應用到自動駕駛汽車上面。當然,仍有挑戰需要解決。儘管強化學習自動化了機器人複雜的手動編碼,但仍然需要工程師定義機器人的目標以及成功的要素——對於現實世界環境來説,這是一項既耗時又開放的練習。此外,在硬件上進行長時間的學習也會給機器人造成磨損,可能需要人類的干預或修復。研究人員表示,將模擬器訓練與現實世界學習相結合可能會很有成效。儘管會有一些還未解決的挑戰,但Dreamer算法還是將機器人技術中的人工智能向前推進了一大步。俄勒岡州立大學的機器人學教授喬納森·赫斯特(Jonathan Hurst)表示,“強化學習將成為機器人控制未來的基石工具”。哈夫納稱,將來如果能教會這隻機器狗理解語音指令就太好了。該團隊希望將攝像頭與機器狗連接起來,使其具有視覺能力。這樣就能夠和真實的小狗相似,可以讓其幫忙在房間裏尋找物品。AIBO
在90年代時,索尼推出了一款寵物機械狗—AIBO,但後續由於種種原因導致停產了,在經過長達12年的沉澱後,索尼推出了全新的AIBO,它用了4000個零件、22個執行器並且內置多個傳感器、相機等功能,使它更加趨近於真實的狗狗。圖源:索尼官網