直擊使用者痛點,趨動科技如何在AI算力的藍海市場中迅速崛起?
編者按:本文來自戈壁創投投稿,36氪經授權釋出。
「G」Talk是一檔聚焦於戈壁創投持續關注賽道的投資人對話欄目,我們透過投資人與創業者之間的問答和思辨,嘗試梳理出創始人、CEO們在所屬賽道創業道路上的行業knowhow以及他們未來無限的可能。
第一期對話我們邀請到了戈壁創投合夥人胡唐駿先生對話趨動科技CEO王鯤博士。6月8日,趨動科技對外宣佈獲得了由戈壁創投領投的近千萬美元Pre-A輪投資。胡唐駿先生認為,隨著全球AI產業發展的持續加速,AI應用在各行各業加速落地,AI技術也隨之成為科技巨頭的標配。而在日漸成熟的AI產業中,有一片尚待開墾的藍海市場——AI算力。
2020年,是真正意義上的新基建元年,市場普遍焦慮的“資本寒冬季”其實是加速市場發展、沉澱的關鍵節點。AI的場景落地甚至因由突如其來的疫情,一定程度上刺激了線上數字化的程序。而對於創業者而言,還是需要足夠的核心競爭力來應對外界各種複雜的變化。而AI 算力作為AI技術與產業大規模發展的巨大驅動力,將成為整個新基建的核心支撐。但一方面算力昂貴,多年來難以實現“平民化”;另一方面,擁有大量算力的使用者也面臨著如何實現資源池化的新課題。
在這一背景下,戈壁創投迅速鎖定了趨動科技這一深耕AI算力十多年的團隊,在第一次見面即一拍即合。基於多年toB領域的投資經驗,我們認為一個團隊的產品、技術和服務能力併為“三駕馬車”,在創業公司的發展中起著至關重要的作用。趨動科技憑藉對使用者痛點的深刻認知以及技術和行業的前瞻性,在王鯤博士的帶領下在一年內就迅速站穩AI算力市場,聚攏了多個行業頭部客戶,很好地驗證了戈壁創投的這一觀點。
以下是本次訪談的主要內容,經小編整理:
胡唐駿:趨動科技正在做的事情?
王鯤博士:當前,全球AI算力需求迅猛增長。2012年至今,雲端AI算力已經增長了超過30萬倍,且在可預見的將來,仍將保持相當高的增速。
同時,在包括網際網路、安防、教育、醫療、智慧製造及自動駕駛等行業,越來越多的使用者開始將AI應用到生產場景之中,趨動科技看到了AI的高速發展,也看到了使用者的諸多痛點。
AI市場裡使用者的痛點是什麼?是算力昂貴。
因為使用者缺乏AI算力的資源池化和虛擬化技術,導致AI資源尤其是算力的利用率非常低,從而增加了成本。此外,使用者沒有辦法很好地實現資源池化,因此也不能在資料中心內高效地排程和使用AI算力。
趨動科技看到了AI使用者的這些痛點,基於這些痛點以及團隊的技術背景,推出了國際領先的AI算力虛擬化和資源池化解決方案,幫助客戶構建資料中心級AI加速器資源池,使用者可以共享使用資料中心內任何一臺伺服器之上的AI算力。
此外,透過幫助使用者構建高效的AI算力資源池,不但能夠幫助使用者提高算力的利用率,從而降低成本,而且能夠幫助使用者將AI應用的開發和部署變得更加簡潔與快捷。
事物發展的三個階段make it work 、make it perform and make it cheap。AI演算法已經讓我們能夠做到很多以前做不到的事情,人臉識別、目標檢測、語音識別等等。都已經進入make it work的階段。而算力的強大才能夠實現make it perform,以前可能一年才能完成的事情,現在一週甚至一天就能夠完成。只有當AI技術在各行各業落地,才能真正成為人類社會不可忽視的一部分,而AI算力的平民化則是這一趨勢中不可忽視的一個階段。
AI算力是AI技術與產業大規模發展的巨大推動力,趨動科技認為AI算力的平民化是必然趨勢,讓每個企業都能夠用得起高效率、高效能的算力是趨動科技的任務與挑戰,也是產業發展的必然。
胡唐駿:能否從客戶角度深入剖析我們對於“AI算力平民化”的追求?
王鯤博士:目前,趨動科技主要的客戶中,除了使用公有云的,還有很多使用的是私有云或者混合雲。
從客戶角度而言,趨動科技目前的客戶大部分擁有大量的AI算力,對他們而言,資源池化的價值比虛擬化技術的價值更高。因為虛擬化技術主要解決的是晶片在多個使用者間共享的問題,而資源池化解決的是更高層次的問題。
例如,很多使用者可能在資料中心裡有幾百臺、上千臺伺服器,他們也有幾千塊甚至上萬塊的加速卡,對於這類使用者而言,他們不但關心每張卡的效率,也關心整個資料中心從資源池角度的利用率和使用效率。
除了有公有云的客戶,還有一些客戶,如網際網路行業或AI行業的巨頭,可能使用自建的私有云,在AI算力池化方面也有非常強烈的需求。
雖然需求一直存在,但AI算力的資源池化卻是一個比較新的課題。
資料中心的三個最主要的支柱是計算、儲存和網路,其中儲存與網路的資源池化和軟體定義已經發展得較為充分,但AI算力的軟體定義和資源池化才剛剛開始。
所以,趨動科技的起步較早,從技術角度而言,趨動科技提供的解決方案是當前市場上最好的選項之一。在AI算力池化這個新興的藍海市場,這是趨動科技的核心競爭力。
胡唐駿:如何在成立如此短時間內取得這麼好的成績?
王鯤博士:首先,團隊層面。
我本人博士畢業於中國科技大學計算機系,是中國科學院優秀博士論文獎,以及全國優秀博士論文提名獎獲得者。博士畢業以後供職過三家IT行業巨頭公司:IBM中國研究院、微軟亞太研發集團以及戴爾EMC中國研究院。離職創辦趨動科技之前,我是戴爾EMC中國研究院的院長。
趨動科技的核心骨幹團隊,包括技術團隊、市場銷售團隊都有著IBM研究院、微軟研究院、EMC研究院以及像BAT、位元組跳動等國內外頂級科技公司的工作背景,這些同事有著非常長時間的研究和工作經驗。
此外,我們從十年前,甚至更早就開始研究CPU虛擬化、FGPA虛擬化、GPU虛擬化的課題,整個團隊有著非常長時間的合作經驗技術積累,一直在晶片虛擬化和資源池化的方面,長期從事研究和開發的工作。
也就是說,趨動科技在晶片虛擬化和資源池化方面曾做過長期的研究和開發工作,長時間的積累與沉澱是趨動科技能夠快速發展的核心原因。
我們看到,GPU資源池化市場是一個很明顯的依靠技術的市場,除了持續不斷的積累所帶來的厚積薄發,趨動科技始終保持在研發層面的巨大投入,並透過建立且不斷完善的人才引進機制,確保在技術層面的領先地位。
其次,市場環境層面。
2019年成立至今,我們在市場上看到了一些從去年到今年都沒有變化的一部分,也看到了一些發生變化的部分。首先,沒有改變的趨勢是AI技術仍然在全球範圍內快速發展:AI的應用仍然在各個行業持續落地,整個行業、整個社會乃至整個全球對AI算力的需求依然高速增長。雖然我們在這個時間週期經歷了一些“黑天鵝”事件,但實際上我們看到,整個行業的發展態勢是比較穩定的。
另外,在AI產業的高速發展中,國產AI晶片火速崛起,5G產業持續催生出新的場景和新的應用,像雲遊戲、雲VR這樣的應用,讓我們看到除了AI場景以外,其實還有其他新的場景出現在拓展市場的邊界,繼續拉動人類社會對於算力的需求,也給我們的發展帶來越來越好的市場環境,這是在發生變化的部分。
再次,企業層面。
經由多年的課題研發,我們預判未來的AI算力市場一定會有一個高速的增長。在這其中,趨動科技作為獨立第三方軟體公司有獨特的優勢——對所有的硬體晶片來講,趨動科技都是完全獨立的第三方。因此,我們可以投入研發力量,在國產AI晶片市場中儘量多的支援硬體晶片廠商。
實際上,我們已經支援了寒武紀的MLU100,還有幾家國產晶片,我們也在陸續支援之中。未來,我們的願景是幫助企業使用者和晶片使用者構建一個異構的加速器資源池,使用者可以基於自己對價格、成本、算力、效能等各方面的考慮,採購不同廠商的加速晶片,使用者的AI應用不需要修改程式碼就能執行在由我們的軟體所構建的異構加速器資源池之上,充分利用來自不同廠商的加速晶片,這是我們的目標和願景,當然從技術上這樣的願景挑戰也是非常大的。
而從硬體晶片廠商的角度而言,其更多的精力會放在自家晶片的研發以及效能調優、工具鏈等方面的工作上,反而會跟趨動科技形成了非常好的互補關係。
每家晶片廠商都會努力把晶片做得更好,軟體做得更完備,而趨動科技作為獨立的第三方軟體廠商,會盡量地在同一平臺上相容多家晶片,最終實現合作共贏,讓企業客戶能夠用得上物美價廉而又靈活的AI算力。
胡唐駿:對於我們已有客戶的落地情況進展?可以分享一些案例麼?
王鯤博士:分享兩個我們在頭部網際網路企業的典型使用者案例。他們都需要使用AI算力GPU資源池來提高效率,達成業務目標。
第一個案例,客戶是一家頭部網際網路電商平臺。我們知道人工智慧裡既有推理任務,也有訓練任務。這個客戶有大量的線上推理任務要跑。他們的推理任務有一個特點,就是既要使用相當一部分GPU資源,也要使用相當一部分的CPU的資源。在這種情況下,假如沒有我們的GPU資源池化技術,這個任務就必須要放在一個GPU伺服器上去跑。而當跑在GPU伺服器上以後,客戶很快就發現了他們的CPU成為瓶頸,GPU利用率無論如何都不能夠提升。因為“整個木桶的短板”並不在GPU上而在CPU上。
客戶在使用我們的軟體之前也考慮過讓開發部門來改程式碼,把這個推理任務拆成兩個部分:CPU上一個部分和GPU上一個部分。可在實際上,首先這種拆任務的做法成本非常高,其次這種做法也無法通用。第一個碰到這種情況的業務部門要改,第二個業務部門遇到了類似的問題也得改程式碼,這個方法並不通用。
而使用我們的GPU池化軟體就很好地幫他解決了這個問題。我們能夠幫客戶建立一個GPU資源池,客戶可以把所有這些推理業務直接跑在純CPU的伺服器上,透過網路來使用資源池裡面的遠端的GPU,而客戶的程式碼完全不需要做任何修改,就可以直接跑起來。
所以在這種情況下,第一我們解決了客戶的問題,他們的CPU、GPU都可以充分利用。第二,客戶完全不需要改任何程式碼,成本非常低,可以很快上線,執行效果也非常的好。從結果看,我們的軟體幫助客戶顯著地提高了GPU利用率,降低了成本。
另外一個案例是頭部網際網路搜尋的客戶,也是想要使用GPU資源池。不過他們的業務不是推理而是訓練。客戶有很多臺GPU伺服器,有的是4卡伺服器,有的是8卡伺服器。他們的需求是把所有GPU卡都統一納入到一個資源池來管理。舉個例子,如果是100臺8卡伺服器,客戶希望看到的不是100個8張卡的小資源池而是1個800張卡的大資源池,在這一個資源池裡他們希望能夠做到任何訓練任務都能夠跑起來。建成資源池之前,如果伺服器只有8張卡,如果要跑一個超過8卡的訓練,它是跑不起來的。
我們幫助他們構建了一個巨大的GPU資源池,使他們能夠跑更大規模的訓練任務。這是給客戶帶來的第一個好處,其次原來的多臺GPU伺服器,就像是一個個小水桶,可能會導致每一臺伺服器在執行中有一些剩餘的零散的卡,比方說這臺伺服器剩一張卡,那臺伺服器剩兩張卡,這種情況是很普遍的。
在這種情況下,這些零散的碎片化的資源是很難利用起來的。但是在我們的軟體框架之下,我們把所有GPU卡全部放在一個資源池裡面,就不會存在這種碎片化的資源情況。這臺機器剩一張卡,那臺機器剩兩張卡,沒有關係,我們可以把這三張卡放在一起給到使用者的另一個任務,把它用起來,使得整個的資源池裡沒有這樣的碎片,利用率自然就會變得更高,使用者的業務也可以跑得更快。
這兩個案例是目前兩個非常典型的,一個是訓練的任務,一個是推理的任務,他們都有非常強的資源池化需求,也都是頭部的客戶。他們的使用場景不一樣,但他們的需求點對我們的軟體來說,是非常接近的。
胡唐駿:資本寒冬對行業以及你們有什麼影響?
王鯤博士:近年來,很多媒體和投資機構經常提到資本寒冬,其實從資本角度而言算不上寒冬,而是迴歸理性,迴歸商業本質。
從大環境角度而言,不管是面對資本寒冬還是新冠疫情,真誠地創造價值、做有意義的事情的企業並不會死亡,倒下的企業其實已經處在慢性死亡的過程中,只不過被外力加速了程序。
一個公司從初創時期的idea一直做到上市乃至成為巨頭,本身就要經歷各種風雨,沒有哪家企業能夠一直保持順風順水的狀態。經受住疫情考驗的公司,反而會鳳凰涅槃,擁有更加旺盛的生命力和競爭力,其實有利於推動實體經濟和前沿技術的發展。
我們在疫情期間看到,大部分客戶對於降本增效的需求是在快速而且顯著提升的,也就是我們通常提到的要加速線上化、數字化。這對我們來講其實是一件非常好的事情。趨動科技獵戶座資源池化解決方案軟體的本質就是幫助使用者降低算力的成本,藉由AI算力的平民化讓客戶降本增效。所以可以肯定地講,這次疫情之於我們,不但沒有讓我們的業務發展減速,反而是加快了我們業務的開展。
我們團隊是從國家法定假期結束後的第一天就恢復了上班。雖然我們都是遠端在家辦公 ,但是藉助各種視訊會議系統,大部分客戶也很早就啟動了遠端辦公,而且我們的軟體部署也支援遠端操作,這是軟體企業的優勢之一。越來越多的客戶來了解我們的軟體能幫他們做什麼,如何協助他們降本增效。
我們目前覆蓋了頭部的幾十家網際網路、AI、還有公有云等領域的企業,他們都在使用或試用我們的軟體。我們已經是公有云國際巨頭AWS的技術合作夥伴,讓AWS的客戶能夠使用我們的技術。
胡唐駿:我們未來大方向層面的規劃?
王鯤博士:趨動科技未來主要有兩方面的規劃:第一是保持大規模的研發投入,以確保技術層面的市場領先地位;第二是加速商業化程序。
趨動科技在市場上的技術是領先的,我們要始終保持這種技術上的領先性,我們會持續加大研發投入,吸引最優秀的人才加入我們,這始終是我們的核心要務之一。不管未來除了AI行業、雲遊戲、雲VR,趨動是否進入其他領域,這一點都不會變。
目前,趨動科技已經搭建了完整的售前、銷售、市場團隊。在COO石鳳華的領導下,正在非常高效地開展相關工作,我們會持續地加大市場方面的投入,加速商業化程序。
趨動科技剛剛完成了由戈壁創投領投的新一輪融資,從資本層面獲得了極大的助力,有利於實現剛剛提到的研發投入和加速商業化程序這兩個重要任務。未來我們也會在融資方面繼續關注,在合適的時間節點,再來看後續的資本層面的支援。
文章來源:戈壁創投