近日,AI芯片公司鯤雲科技發佈全球首款數據流AI芯片CAISA,面向邊緣端和數據中心AI推理,已完成量產,並同步發佈了基於CAISA芯片的星空X3和X9加速卡。據介紹,CAISA在峯值算力提升6倍的同時,能實現95.4%的芯片利用率。
之所以能實現這樣大幅度的實測算力提升,鯤雲科技CEO牛昕宇介紹,是因為相比於其他現有的AI芯片,CAISA裏面沒有任何指令,芯片內所有計算都通過控制數據的流動來完成。
目前,主流的AI芯片是基於指令集的計算架構,這種架構中,由於指令協同的不確定性,計算與數據讀寫無法深度重疊,數據移動的過程中,部分時間計算單元處於等待數據狀態,這造成了閒置計算單元和芯片利用率的下降。而CAISA內就像一個定製的數據流水線,數據傳輸和計算同步進行,沒有冗餘的指令,也不需要譯碼指令,從而消除計算資源閒置,帶來芯片利用率的提升。在此之上,CAISA通過流水線動態重組,可通用支持主流CNN算法,保證了架構在AI領域的通用性。
牛昕宇透露,公司目前已經在智能製造、智慧城市、安全生產、軌道交通、智能遙感領域獲得實際落地。針對數據流架構開發的端到端編譯工具鏈RainBuilder可以無縫鏈接TensorFlow、Caffe、 ONNX、Pytorch等多種主流框架。
在AI芯片市場,即使國內有許多新晉公司,不可否認的是,英偉達、英特爾這樣的巨頭仍是目前市場的霸主。牛昕宇認為,目前擺在AI芯片企業面前的有兩條路,一條是比拼峯值算力和工藝的路,這條路上已有巨頭在前,“超越它的一定不是另一款GPU”;而鯤雲選擇了另一條路——追求芯片利用率,將同樣的峯值算力發揮出更高的實測性能。(文 | AI財經社 唐煜 編 | 趙豔秋)