雷鋒網按:2020 年 8 月 7 日,全球人工智慧和機器人峰會(CCF-GAIR 2020)正式開幕。CCF-GAIR 2020 峰會由中國計算機學會(CCF)主辦,香港中文大學(深圳)、雷鋒網聯合承辦,鵬城實驗室、深圳市人工智慧與機器人研究院協辦。從 2016 年的學產結合,2017 年的產業落地,2018 年的垂直細分,2019 年的人工智慧 40 週年,峰會一直致力於打造國內人工智慧和機器人領域規模最大、規格最高、跨界最廣的學術、工業和投資平臺。
2020年8月8日上午,來自學術界、工業街、投資界的重磅嘉賓齊聚CCF-GAIR 2020 AI晶片專場共同探討新基建浪潮下AI晶片發展的絕佳機遇。
睿思芯科副總裁王衛在《領域架構促進人工智慧發展》的演講中指出,在人工智慧時代,算力提升遇到巨大挑戰,伴隨工藝進步速度下降,傳統的提升效能方法也逐漸下降,需要在晶片體系架構和計算體系架構上有所創新。RISC-V發明人David Patterson認為,RISC-V這一新新指令集將促進未來晶片架構的發展,實現算力提升。
王衛從AI晶片的發展歷程與設計時需要考量的因素、AI算力在RISC-V指令集中提升的體現、RISC-V的特點與發展等方面解釋了RISC-V對人工智慧發展的推動作用。
睿思芯科副總裁王衛
以下為王衛的主題演講內容,雷鋒網做了不改變原意的編輯與整理:
我們公司是一家專注於做RISC-V開源指令集晶片的公司,我們也試圖透過觀察整個晶片的發展歷史展望未來,瞭解做AI晶片應該研發的方向,以及整個行業晶片體系結構的發展方向。今天主要分享一些對未來AI晶片發展方向和趨勢的思考。
尋找提升算力的新思路
今天,大家所提的AI,主要是針對神經網路這種特定的演算法。從基本的原理和演算法來講,大概30年前,就已經有基本的框架了。但為什麼直到最近幾年,大概是從2012年開始,AI才真正得到了爆發式的應用,並在實際中有所體現,這主要是因為算力的增長。
很多業內的權威專家都在探討算力、演算法和資料這三個方面哪一個更重要一些,其實三方面都重要。從歷史發展看,有了演算法,如果沒有足夠的算力支撐,就沒有辦法在實踐中得到真正的應用。有了演算法和算力,必須要有大量的資料才能夠得到我們想要的結果,所以這三者的關係應該是缺一不可的,不過這三個方面的發展程度此起彼伏,在不同的階段有不同的發展方向,某一方面可能會走得快一點,但很快它也會驅動其他幾個方面共同發展。
有了演算法,只有算力跟上,才能真正發揮作用,對整個社會產生實際意義。目前在演算法提升的道路上,遇到了巨大挑戰。在晶片效能的發展中,最早是摩爾定律預言整個工業界都會按照一定的速度穩定地向前發展。但同時,為了保持摩爾定律的發展速度,除了工藝上的進步,還包括體系結構等其他方面的進步。例如,為了保持算力的增長速度,從最早的單核代多核並行運算,又到串並行協同運算,算力持續增長。但最近幾年,現有的思路方法幾乎在提升算力上失效,需要新的思路來替代,即晶片體系架構和計算體系架構的創新。
谷歌TPU帶來的啟發
以谷歌為例,谷歌無論是在硬體還是在軟體上都有強大的基礎,他們做出一個晶片可能一開始效果並不好,但是後來透過不斷挑戰演算法,以達到算力的巨大提升。如果設計晶片時,一開始就將它的體系結構和演算法有效結合,最終設計出來的晶片肯定就有更好的表現。
這裡引用的人工智慧發展史上的里程碑晶片,即谷歌的TPU,它也是整個行業裡第一款公開且引起大眾關注的AI晶片。至今為止,行業內很多AI晶片的基本結構,就是它的基礎上發展過來的,具有代表性意義。這其實體現了Domain specific architectures(特定領域的體系結構)的強大力量,因為它是特定地為神經網路演算法加速去設計的一種晶片硬體結構,透過對這個特定目標的機制最佳化,做出來一個性能好、算力強大,在功耗和能耗比上也在當時達到很好的指標的晶片。當然,後續又有很多初創公司或成熟公司,飛速地發展他們的產品、技術,更多、更強、更好、的晶片便湧現出來。
谷歌TPU到了第三代,比第一代有很大的進步。TPU3採用水冷技術降低能耗比,為什麼會用到水冷技術?因為空氣的散熱能力有限,單純用風扇無法散走足夠的熱量,必須採用水冷方式才能保證晶片正常工作。但這一晶片主要應用於資料中心,需要非常好的環境、相對較高的成本,才能保證有效降低能耗比的條件。當應用到終端或邊緣端,不太可能有這些條件提供保障,因此在設計終端晶片和邊緣端晶片時,思路會有所不同。
架構自由創新是RISC-V的關鍵優勢
在具體的實現方式上,RISC-V發明人David Patterson認為,RISC-V指令集會促進未來晶片架構的發展,真正釋放晶片設計的巨大潛力,讓更多的人能夠在專屬領域內實現軟硬結合,設計出合適的架構。
RISC-V作為一個計算機體系架構,是近期非常熱門的話題,RISC-V的特點是什麼?開源的、免費的、低成本的,是RISC-V的絕對優勢。如果從晶片的體系結構角度而言,其最大的優勢則是像樂高積木一樣的模組化結構。RISC-V把指令集中的不同功能子集分得很細緻,不同的模組之間可以自由地排列組合,而且整個指令集中預留了大量自動指令集,可以讓客戶在晶片層面結合子集的演算法和應用需求,定製一個對應自己專屬場景最有用、最最佳化的命令。這也是Domain specific architectures的經典體現。
因此,RISC-V最關鍵的技術優勢在於可以在架構上自由創新。在RISC-V指令集中,AI算力的提升體現在其向量擴充套件指令集方面,規定了跟CPU本身高度耦合的擴充套件指令集,可以透過向量的擴充套件指令集的運算,從硬體上加速各種矩陣乘加的運算。目前所有的深度學習,對算力要求最高的是各種矩陣運算,恰好能夠在RISC-V指令集中實現。
另外,由於RISC-V是開源的,會吸引更多人加入這一體系結構中,去研發、去競爭,帶來更多創新,推動自主可控的新基建。
對於RISC-V,大家更多的是在強調其在終端或邊緣的應用。事實上,RISC-V本身沒有適用於終端或者雲端的屬性,RISC-V也可以在雲端,在高效能、大規模運算上發揮優勢。但作為指令集,越複雜的應用對整個生態的依賴程度越高,包括編譯器、工具鏈、具體架構的設計,相對雲端而言,邊緣端對生態的依賴程度更低,因此RISC-V在雲端的應用會晚於在邊緣端的應用。
開源架構更需國際協作
RISC-V的發展非常迅速,RISC-V基金會已有500多個成員,包括全球各地的軟體公司、晶片公司、服務商、雲服務提供商等,中國也有非常多的公司在積極地參與RISC-V開源組織。在軟體方面,開源的東西有越多的人參與,它的發展速度就越快,甚至會呈指數級發展,RISC-V也是如此。
我們對RISC-V的認知是結合了所有的開源專案,包括硬體、軟體,它必然需要國際上的協作,在一個特定的小圈子裡,在特定地域範圍內做開源,最終是不可能成功的。如果你希望享受開源的成果,就應該更積極地去參與,更積極地對整個社群有所貢獻。所以目前國內已經有很多公司在積極參與RISC-V基金會的活動。包括我們公司的創始人譚章熹博士,本身就是RISC-V基金會董事會的成員之一,也非常積極地把我們所做的RISC-V方面的一些研究成果、生態環境的促進工作往前推進,希望更加積極地回饋RISC-V社群,也希望更多人加入到RISC-V開源社群中來,希望未來RISC-V、x86、ARM能夠形成三足鼎立的格局。
尤其是對中國而言,新基建下,一個開源的、開放的,充分國際合作且無人能阻止的平臺,我們認為意義重大,對它的發展抱有非常大的信心。因為我們也看到在短短一年之內,在中國整個領域相關的公司和產品都發展得非常迅速,我們也希望對整個發展做出貢獻,希望跟更多業界的同仁們合作,如果大家希望在RISC-V基金會能有更多的反饋,我們也非常願意進行這樣的合作。
注:文中配圖雷鋒網獲演講者授權使用。