人工智慧深度學習顯然是智慧行業的一個新高地,但有一個廣泛的共識,那就是接入的計算越多、資料越龐大是深度學習的重要要素。這是很顯然的,首先是大型分散式系統(像Google大腦),接著是神經網路在GPU上的快速部署,還有一個被低估的因素是大規模基準測試的存在。大規模基準測試(例如ImageNet)可以為新技術的學術發展提供重要的測試環境,從而能夠展示出技術的進度。如果沒有這些基準測試,學術研究只能停留在解決小規模問題上,而在這些場景中深度學習的好處並不能顯現出來。
目前,使用者產生和消費的內容變得更加視覺化,正因如此,分析和理解圖片的能力在商業上顯得越來越重要。隨著深度學習社群走向更豐富的媒體(例如影片),我們相信規模化將會變得更加重要。擴充套件人工智慧非常具有挑戰性,尤其是單一GPU的規模化,甚至單一資料中心的規模化。然而,當我們逐漸走向更加複雜的問題時,實現這樣的規模化是必須的。
大多數的深度學習工作集中於被稱之為“感性問題”,例如理解圖片、影片、演講和音訊等。直觀上來說,這是有道理的,因為許多深度學習方法會透過編碼模擬偏向,這與感知是一致的。例如,這些網路通常都有和人類感知相平行的結構,或者它們具有可以捕捉偏向的結構,就像鄰里之間的偏向一樣。和相距較遠的畫素相比,靠近的這些畫素相互之間的聯絡可能更緊密。漸漸地我們將看見深度學習將會用於許多大型系統中,例如機器翻譯。在這些情況下深度學習通常被用於解決一些有代表性的問題,而語言結構將會透過其他機器學習技術解決。我們會看到越來越多的這樣的混合系統,例如我們購物的體驗是人工智慧支援的,其中也包括深度學習。
深度學習和強化學習的結合是一個技術上的發展,延續的深度學習在自然語言處理和計算機視覺中的應用突破。值得關注的是之前的深度學習的應用停留在預測上,比如說對影象的識別、機器翻譯。對於深度學習來說,真正需要的大資料,就目前而言,可以這麼說,沒有大資料,就沒有好的深度學習模型,進而就沒有非常智慧的系統。
近幾年因為深度學習在某些方面取得了一些喜人的進展,這個領域才又開始火了起來。藉助於深度學習演算法,人們似乎終於找到了如何解決“抽象概念”這個橫亙在機器學習領域多年難題的方法。
迄今為止,大資料生態系統專注於大量資料蒐集、管理和策劃。很顯然,這裡也有很多關於分析和預測方面的工作。但是從根本上來說,企業使用者並不關心這一點。企業使用者僅關心產出,也就是這些資料是否會改變我的行為方式和決定。我們相信這是接下來五年將要重點解決的問題,我們也相信人工智慧能把資料和更好的決策之間連線起來。
很顯然,深度學習將會在這個演化過程中扮演重要角色,同時在和其他人工智慧方法相結合的時候也會做到這一點。接下來的五年中,我們將會看見更多的混合系統,在這些系統中,深度學習會用於解決一些困難的感知型任務,其他人工智慧和機器學習技術將被用於解決其他難題,例如推理等。