人工智能核心創新觸及天花板？

2020-06-24由梁丘憐翠發佈於科技

本文轉自【科技日報】；

“目前人工智能論文數量激增，泥沙俱下，導致部分論文質量不高，但這並不能説明人工智能發展停滯不前，而是表明目前有更多的研究人員投入到了這個火熱的研究方向。”

最近幾年，在人工智能領域，從基礎算法到落地應用研究成果不斷湧現，其中致力於人工智能落地的應用成果尤其突出，目前人工智能許多子領域的系統在性能上已經滿足了具體應用場景的落地要求。

但這能説明人工智能領域的核心創新存在明顯進步嗎？近日，《科學》雜誌刊登的一篇標題為《人工智能某些領域的核心進展一直停滯不前》的文章，對目前人工智能的研究成果提出了質疑。作者馬修·赫特森指出，研究員聲稱的核心創新只是對原算法的微改進，新技術與多年前的舊算法在性能上相差不大。

近幾年人工智能領域快速發展，其應用場景不斷拓寬，為何該論文卻認為人工智能某些領域的核心進展停滯不前？當前人工智能的核心創新是否已經觸及了“天花板”？就此，科技日報記者採訪了有關專家。

AI核心研究是否取得突破進展存爭議

具體來説，《科學》雜誌上刊登的這篇文章指出的現象主要有哪些呢？

該文章引用了近期在神經網絡推薦算法、對抗性訓練、自然語言模型等領域的批判性論文，指出這些年來一些人工智能算法發展中面臨的問題。

作者馬修·赫特森認為，當前部分子領域算法核心的改進並未取得突破進展。同時，當前多數論文傾向於提出新算法而不是在舊算法上調優，這樣做的主要原因是更容易發表論文，儘管在舊算法上調優的效果和新算法的效果相差無幾。

“目前人工智能論文數量激增，泥沙俱下，導致部分論文質量不高，選題跟風甚至論文灌水的現象確實存在，但這並不能説明人工智能發展停滯不前，而是表明目前有更多的學者和研究人員投入到了這個火熱的研究方向。”微眾銀行人工智能首席科學家範力欣在接受科技日報記者採訪時表示。

範力欣強調，尤其需要指出的是，年輕學子中的佼佼者，包括博士、學士甚至高中生，都有了登上人工智能頂會頂刊嶄露頭角的機會。面對這樣的形勢，以偏概全地以“核心研究停滯不前”來總結是不合適的。

事實上，近幾年，人工智能某些領域的創新，包括算法核心創新，還是取得了較為明顯的進步。

如在自然語言處理領域，《科學》雜誌這篇報道中提到的長短期記憶網絡（LSTM）是1997年提出的，而當前，Transformer架構在速度和性能方面，比長短期記憶網絡要更優越；預訓練模型方面，以BERT為代表的預訓練模型不僅在很多任務上獲得成功，更帶來了自然語言處理研究和應用範式的變化。更重要的是這些改進已經在相對比較公認的數據集上測試過，有的還在實際的產業應用中獲得成功。

對此，南京大學人工智能學院教授俞揚也指出，近幾年人工智能國際頂級會議的投稿數量持續上漲，如近期神經信息處理系統大會會議的投稿接近一萬篇，其中技術“催熟”、審稿隨機的現象確實存在。同時，革新性的工作往往容易遭受質疑，在海量投稿中真正的技術進步也容易被淹沒。

核心創新要瞄準“痛點”

當前，在人工智能領域“洶湧”的浪潮中，研究人員的成果如何稱得上核心創新、突破進展？

“能夠克服以往的侷限，在我看來就是突破。克服的侷限越關鍵、越深刻、越普適，突破就越巨大。”俞揚舉例説，例如，以往在國際象棋上戰勝人類的搜索算法，無法擴展到搜索空間更加巨大的圍棋上，而廣為人知的阿爾法圍棋便利用機器學習技術減少了巨大的搜索空間，從而取得成功。

範力欣認為，雖然人工智能領域的研究很火熱，但該領域現在仍然處於積累實踐觀察的初級階段。現在的核心創新, 就是通過觀察與分析新的現象，不斷提升現有方法的實際性能，並收集數據、證據。長期大量的觀測後，真正有價值的是無數小的觀察結果。

那對算法進行創新需要哪些條件？“首先是要找準問題，特別是關注制約算法性能的‘瓶頸’問題，這也是目前人工智能算法改進最難的。”廈門大學人工智能系副教授陳毅東説。

找到問題之後，需要提出合適的應對方法。一方面，新方法可以來源於對目標任務領域知識的結合，這需要研究者對目標任務和相關領域知識有全面的把握；另一方面，新方法還可以來源於其他學科，仿生技術就是常用的方式，這需要研究者對跨學科知識有一定的涉獵。

“除此以外，由於現實條件的限制，如數據、算力等，算法改進要成功還需要根據現實條件進行各種折中和裁剪。這又需要研究者具有相當的工程能力和實踐經驗。”陳毅東説。

科技日報記者瞭解到，2015年誕生的阿爾法圍棋組成部分中，搜索樹方法發表於2006年，策略梯度強化學習發表於2000年，卷積神經網絡的提出則更早。“科學發展常常是證偽的過程，而不是一次性提出一個開創性的新理論。只有集量變為質變, 才能為即將到來的理論突破打下堅實可靠的基礎。”範力欣説。

“人工智能基礎研究要取得突破，很有可能需要做長期並且有爭議的工作。”俞揚指出，如何為這樣的研究工作、研究者提供足夠的生存空間，對熱點之外的研究方向有獨立清晰的判斷力，尤其是在人工智能熱浪一波接一波的環境下保持對基礎研發的投入，可能是為推動人工智能基礎研發、產生原創性基礎成果需要考慮的重要問題。

還無法做到全領域創新評價標準統一

根據上述論文的觀察，不少研究工作都誇大了其改進的效果，而其中的根源問題之一，是當前人工智能相關領域的創新評價標準不統一，那麼目前有無解決措施？

事實上，當前有不少解決途徑，如代碼開源、公開模型、公開實驗結果等手段，都能夠加強研究工作的可復現性和可對比性。

不過，作為一個還在不斷髮展變化的領域，新問題、新領域、新現象、新關注點層出不窮，全領域範圍要做到評價標準統一十分困難。但在一些已經成形的領域，有組織地制定統一評價標準是有可能而且很必要的。

陳毅東認為，首先制定評測標準需要一定站位高度，也面臨相當的難度和工作量，還需要根據研究前沿的變化不斷進行調整更新。因此，必須有組織地開展，建議可以由相關學會的專委會、學術與產業聯盟有組織地引導領域學者、產業界研究人員來共同完成。

“其次，真實的場景和數據往往來源於產業界，建議學術界和產業界更加密切地配合，共同研討相關領域的前沿動態、發展方向和應用痛點，制定相應的標準數據集、搭建平台，並面向科研開放數據、接口甚至計算資源。”陳毅東説。

從應用的角度看，當前人工智能技術仍然處於積累實踐觀察的初級階段，面臨着在許多實際環境條件下無法奏效的困境。

近期的學術會議在論文的評價標準上，也越來越強調研究工作的可復現性。俞揚建議，要把基礎研究與國內的實際生產需求結合，一方面在特別的需求牽引下容易產生原創成果；另一方面，來自實際需求的正反饋容易形成閉環激勵，有利於不斷創新，形成自主技術體系。

“實踐是檢驗真理的唯一標準，任何算法是否是真正的創新都要接受實踐的檢驗。堅持不懈就會收穫美好的結果, 我個人是持樂觀態度的。文章作者其實也認同這一點, 提出各種方法必須經過嚴格的驗證, 只是文章中沒有全面反映現在人工智能發展的總體態勢，存在以偏概全誤導公眾的可能。”範力欣説。