本文轉自【科技日報】;
“我們應該激勵更多為視障人士創新的技術成果,讓其儘早轉化成真正讓視障人士受益的產品,這需要構建一個良好的創新生態。”
日新月異的科技力量正為視障人士“重見光明”帶來希望。
11月底,谷歌表示,其研發的一款人工智能系統,能夠幫助視障人士獨立參加跑步比賽。據悉,依靠該系統,視障人士不需要依靠人類嚮導或導盲犬自己便可以跑完全程。那麼,這款人工智能系統如何讓視障人士參加跑步比賽?近年來在幫助視障人士恢復視力等方面,人工智能有哪些階段性成果?目前這些產品距離應用還有多遠?
用聲音信號為盲人引路
現在很多崇尚健身的人喜歡挑戰馬拉松,而盲人如何參與跑完“半馬”或“全馬”呢?一位公益組織人員介紹,盲人要參加此類比賽,需陪跑者的幫助。為了方便跑步,盲人和陪跑者之間有1條牽引繩,分別套在各自的手腕上,如同牽手跑步。為了確保盲人在跑步中萬無一失,有時需要兩位陪跑者。但是,盲人平時訓練時,隨時找個陪跑者似乎不太現實。
最近,不少城市開始允許導盲犬進入地鐵、公交車。然而,國內導盲犬的數量十分有限,據統計,截至2017年,導盲犬的數量僅為116只,比大熊貓還稀少,而需要導盲犬服務的視障人士卻多達800萬人左右。每訓練一隻導盲犬需要耗費12萬元—15萬元,導盲犬的壽命約為十幾年,視障人士即使有幸排到一隻,但當它退役之後,視障人士又該如何外出,也是個值得思索的問題。
谷歌開發的這套系統似乎讓我們看到了希望。“這個系統,不需要讓視障人士依靠人類嚮導或導盲犬即可自己跑完全程。”遠望智庫AI事業部部長、圖靈機器人首席戰略官譚茗洲説。
據介紹,這個應用程序使用人工智能模型來識別道路上的一條畫線,並推斷出跑步者與這條線的關係。如果跑步者離線太遠,該應用程序就會向他們佩戴的骨導耳機發送信號,播放令人不快的噪音。聲音是哪隻耳機發出的、音量有多大,都能讓跑步者知道他們需要移動的方向及其離終點有多遠。
譚茗洲解釋道,這有點像汽車上使用的接近警報,當汽車離可能發生碰撞的地方越近時,警報的聲音就會越大,頻率也會越快。使用谷歌的這個系統,跑步者需要把一部安卓手機與經設計的腰帶綁在腰上。這款應用程序不需要連接互聯網即可工作,而且還可考慮多種光照和天氣條件。顯然,若在一些社區,專門為視障人士建立帶有指引標誌的賽道,他們自己便可以安心愉快地奔跑健身。
構建無障礙場景,所感如所見
“視障人士只是眼睛看不見,聲音是可以聽到的,目前的AI科技讓他們真正看見世界不太可能,但可以讓他們體驗到‘如同看見’的效果。”譚茗洲指出。
如今,許多互聯網公司都通過各種方式成功讓視障人士與他們提供的服務實現互動,主要方法就是將文本轉變成由屏幕閲讀器發出的語音。4年前,臉譜公司(Facebook)發起“無障礙倡議”,嘗試採用人工智能技術來豐富盲人、聾人和其他殘疾人士的用户體驗,重點工作之一是重新設計菜單和按鈕結構,運用自動口譯某些照片和視頻的算法使其能為屏幕閲讀器所用,為視障用户提供豐富的場景描述。
作為美國一位專業徒步旅行者,視障人士特雷弗·托馬斯時不時在臉譜上與粉絲分享其帶着愛犬到一些山徑和步道徒步旅行的照片和視頻。他感慨道:“之前因看不見照片,我對是否使用臉譜無所謂,而現在我無法想象沒有臉譜的日子了。”例如,對於舊金山灣落日的照片,含有人工智能技術的屏幕閲讀器會如此描述:這張照片含有自然、户外、雲朵、草地、地平線、植物或樹木;一對夫婦帶着孩子站在加州丹麥城著名風車前面的照片,屏幕閲讀器詮釋:這張照片包括了3個人,微笑,户外。
“顯然,這些解釋不能對照片進行全面描述,但在沒有人工幫助的前提下確實能填補某些空白,視障人士僅需點擊閲讀器來描述,而無須他人來做解釋。”譚茗洲説。
瑞士eyra公司專門為視障人士研發了一種助讀設備。據介紹,這個裝置由三部分組成:掛在耳朵上面的骨傳導耳機及其上面的高清攝像頭,還有AI處理器。AI處理器可以將文本轉化成有聲小説,當然也不用擔心噪音干擾的問題,因為是骨傳導,可以一定程度上減少噪音干擾,給視障人士的生活帶來便利。
今年在拉斯維加斯舉辦的世界最大消費類電子產品展會上,一款智能手機可以通過語音講述周圍的世界,賦予視障人士和弱視用户更豐富的視覺體驗。該應用還可適配智能眼鏡,可將用户的智能手機攝像頭變成用户的眼睛。據介紹,其利用人工智能識別攝像頭指向的視覺信息,包括食品包裝、海報和顯示屏,比如超市的商品信息、車站的顯示投屏、街邊的海報。此外,還可以識別記錄親朋好友的面孔,用户可以用其掃描和尋找周圍的人和事。
三方面發力,釋放科技的人文關懷
據美國勞工部和美國盲人聯盟的統計資料表明,目前視障人士可以順利就業的職業達147種。因此,有學者提出,要想改變視障人士的就業現狀,教育是關鍵一步,特殊教育也需科技化。
目前,很多專為視障人士設計的解決方案,正凸顯着人工智能應用的多樣化和人性化。那麼,如何加速人工智能產品的突破性運用,讓冰冷科技釋放出人文關懷?
譚茗洲指出,這需要三方面發力。首先要培育創新生態。“在2017年德勤全國創新精英挑戰賽總決賽上,一支四川大學在校學生團隊研發的一款視障人士Kindle閲讀器獲獎。”譚茗洲説,我們應該激勵更多像這樣為視障人士創新的技術成果,不讓其沉睡,儘早轉化成真正讓視障人士受益的產品,這就需要構建一個良好的創新生態。
此外,要解決算力和成本之間的矛盾。譚茗洲介紹,機器學習訓練往往要消耗大量的算力,操作中會出現時間上的延遲與信息隱私的安全隱患,這就要將AI算法中的數據上傳到雲端完成。而要滿足終端AI推理運算的實時、可用性需求,就要在本地處理大量的數據,但若在終端本身部署高性能的AI芯片,從成本控制上來看不大現實,在實體場景中部署足夠多的邊緣AI更具一定可行性。
邊緣計算可看作是5G+AI+雲計算的絕佳輔助——“神經末梢”。比如AI導盲杖要實現實時交互與判斷,看到紅綠燈變綠,能夠自動判斷出“可通行”的狀態。運用邊緣計算就不必將路燈信息上傳到雲端,經雲服務器層層判斷才發出行走的提醒。這無疑大大減少延遲帶來的行進風險,也降低雲端計算的超負荷。
最後,還需要等待產業環境的全面成熟:基礎設施的完善,軟硬件基本到位,這樣可在終端設備上更好運行深度學習算法。“加強5G智能網絡建設,保障雲計算及邊緣計算的每一個節點高效可靠利用。”譚茗洲指出。