雖然現在已經是 2017 年了,但毫無疑問,2016 年是人工智能大熱的一年,人工智能技術也開始加速從研究轉向應用。
説到人工智能又學會了什麼?除去具體的研究和產品不談,其實是要回答人工智能技術又應用到了什麼領域上。以下列舉了一些我認為 2016 年新產生的或者值得關注的應用領域:
1. 遊戲(Gaming)
2016 年人工智能界最大的新聞必然是 AlphaGo,知乎上有很多關於 AlphaGo 的討論,這裏就不再贅述。
其他遊戲形式也被廣泛嘗試,例如 Minecraft。微軟研究院[Project Malmo]
(為什麼我們要讓人工智能玩遊戲:微軟 Project AIX)
在 Minecraft 中訓練人工智能爬上游戲中的一座小山。這個任務似乎很簡單,但要求 AI 能瞭解遊戲中所處的環境,識別遊戲場景中的關鍵目標和所需信息。AI 需要跟人類玩家一樣在遊戲中適應環境,完成遊戲目標。
2017 年初人工智能還在撲克牌比賽中戰勝了人類。
2. 計算機視覺(Computer Vision)
計算機視覺一直是人工智能中最受關注的技術之一,原因在於其擁有非常廣泛的應用場景。之前人們比較熟知的領域主要是人臉識別、物體追蹤、文字識別等方面。
2016 年計算機視覺技術有了更深層次和更廣泛的應用。
- 圖像鑑別:包括色情鑑別、廣告識別、暴恐識別、顏值和服裝風格識別等。
- 無人駕駛:雖然無人駕駛技術已經不是 2016 年新產生的技術應用,但越來越多廠商加入到這一領域的戰局並開始進行實測。
- 殘障人士輔助:例如[Seeing AI]
(Seeing AI:計算機視覺十年磨一劍,打造盲人的“瑞士軍刀”)
可以通過分析周圍環境給視障人士提供信息。
- 改進圖像質量:這一點就好像人們説的“腦補成功”。英國的創業公司 Magic Pony(已被 Twitter 收購)採用人工智能,將模糊的圖像或視頻優化為高清版。這家公司展示了在實時的視頻遊戲直播中改善模糊畫面,和把梵高自畫像轉換成一張逼真的照片。使用這樣的技術,或許以後再也不用求高清大圖和擔心視頻看不清了。
- 醫療協助:讓人工智能來獨立診斷病人或許還讓人會產生各種各樣的擔憂,但人工智能技術已經確確實實地應用在了幫助醫生減少誤診等方面。藉助計算機視覺技術,人工智能不僅可以診斷 X 射線圖像,為醫生提供診斷依據,還可以分析 ICU 心電圖,做提前預警。
- 藝術品介紹和推薦:計算機視覺技術可以識別藝術品的特徵,找到相似的藝術品,為普通觀者提供藝術品的更多信息,也為收藏家和客户提供藝術品推薦服務等。
3. 語音識別和語音合成
人工智能在語音識別領域的準確率也已經和人類不相上下了。2016 年的語音識別技術除了提升準確率和廣泛應用到個人助理和智能硬件(如智能手錶,智能音箱等)外,也在其他方面有了很大進步。
語音合成技術除了在向更加擬人的方向進步外,還在音樂生成方面有了一些成果。
- 聲紋識別
- 作曲:Google 的 Project Magenta 將 Machine Learning 用於音樂創作,譜出了一段[90 秒的旋律]
(So, let's talk about this song a Google Brain machine composed)
4. 自然語言處理(NLP)
- Concept Learning:人工智能可以理解一段文本中的某個實體具體指什麼。當我們説到蘋果的時候,是在指蘋果公司呢,還是水果呢?
- 寫詩:還是 Google,通過上千本愛情小説數據訓練深度學習模型,使得其能夠[寫詩]
(Google Is Feeding Romance Novels To Its Artificial Intelligence Engine To Make Its Products More Conversational)
- 寫劇本:在倫敦科幻電影節中,有位來自紐約大學的人工智能研究者 Ross Goodwin,他用自己做的人工智能 Benjamin 寫了一個劇本。Goodwin 找來上世紀八九十年代的科幻電影劇本作為數據,讓 Benjamin 來預測每個詞後面的句子。
5. 情感計算(Affective Conputing)
2016 年湧現出幾十家研究情感計算的初創公司。
CMU 計算機科學學院院長 Andrew Moore 也曾表示,[2016 年是機器情緒識別的分水嶺]
(Why 2016 Could Be a Watershed Year for Emotional Intelligence--in Machines)
2016 年 1 月 Apple 收購了創業公司 Emotient,這家公司通過面部表情來分析人的情緒。
除了計算機視覺上的情感識別,語音和文字上的情感識別研究也有很多成果。例如 Amazon 的 Alexa 就希望能夠通過語音指令中的情緒做出有針對性的回應。
情感識別可以應用在諸如廣告推送、安保監控和治癒自閉症等多個領域。
高準確度的情感計算要求從文字、語音和視覺的多個維度同時進行分析。同樣一段文字用不同的語音和不同的表情説出來會有不同的情緒,同樣的表情配上不同的語音和文字也有表達出不同的感情狀態……
Emotibot 在自然語言理解、語音識別和計算機視覺上都實現了情感識別,同時考量了三個維度,使得情感識別的最終結果更加準確。
目前 Emotibot 在自然語言理解方面也已經做出了 22 種文字情感的分類識別,在語音上分類出了 7 種語音情感(準確率 81%),而在視覺上能識別分類出 7 種人臉表情(準確率 95.63%)。多維度的情感識別使得機器人能夠更加理解用户現在的情感狀態,從而使得交互更加自然和人性化。