隨著社會的發展,人工智慧已經滲透到了各行各業,並與人們的日常生活緊密結合。人工智慧產業也愈加細分、完善,無論是上游的晶片供應商、裝置供應商、資料服務提供商,還是下游的演算法開發團隊、整合商等,產業生態已經被建立並且仍在不斷髮展。
需要注意的一點是,隨著人工智慧產業的發展以及物聯網、大資料技術的普及,以文字、圖形、影象、音訊、影片等非結構化資料為主的資訊急劇增加,面對如此巨大的資訊海洋,特別是非結構化資料資訊,如何儲存、查詢、分析、挖掘和利用這些海量資訊資源就顯得尤為關鍵。
對於智慧系統/應用的開發者來說,其面臨的資料環境越來越龐雜,也越來越無法利用傳統手段來對資料進行管理和使用。
“我本身就是做技術出身,深刻體會到了在目前的AI資料環境下開發者所面臨的問題。”格物鈦創始人崔運凱對創業邦說道。崔運凱先後畢業於上海交通大學和美國賓夕法尼亞大學,曾任賓夕法尼亞大學助理研究員。2015年,崔運凱作為早期員工加入Uber自動駕駛部門,成為該部門最年輕的技術經理,並在2018年回國後加入維智科技(Wayz.ai)擔任合夥人。
2019年,崔運凱與來自Snapchat、依圖等知名企業的合夥人建立了格物鈦,並致力於將其打造為一家優秀的AI資料服務平臺提供商,目前格物鈦可以向開發者提供針對非結構化資料儲存、標註、模型訓練和管理預測的一站式AI服務平臺產品,能夠有效降低AI開發過程中因處理非結構化資料帶來的不斷增長的資料獲取、儲存和處理成本,加速AI開發流程和產品創新。
面對指數級增長的AI資料,開發者的處理手段並沒有得到及時的更新。目前,一家人工智慧企業的大量非結構化資料仍在以檔案的方式儲存在檔案管理系統中,開發者在對資料進行操作或使用時,通常要建立資料夾,然後找到所需要的資料進行手動複製並重新命名,這是一項耗時耗力但幾乎毫無價值的工作流程。
此外,開發者也無法快速而準確地找到對本次開發有價值的資料片段,尤其在面對影片資料時,開發者甚至要透過企業的兼職人員來協助檢視影片檔案並找到相應的影片片段。可以說在人工智慧產業如火如荼的今天,開發者手中的工具軟體卻仍然非常原始。
“我們做產品的本質,就是希望幫助AI開發者更高效地迭代模型,而不是將精力耗費在管理資料的工作上。”崔運凱告訴創業邦。
基於這樣的市場需求,格物鈦打造了TensorBay資料管理SaaS平臺,專為演算法工程師提供非結構化資料集管理服務。TensorBay平臺集資料託管、資料集版本管理、資料視覺化和開發者工具等多種功能於一體,可為演算法訓練提供快速的效率提升解決方案,幫助開發者高效地獲取、加工和管理資料,並透過協同功能開展模型訓練,助力企業快速、低成本地實現AI技術匯入和演算法模型迭代。
具體來說,TensorBay平臺的雲端資料託管功能支援多種格式、多樣場景與多種行業的資料託管,以及原始資料、標註資料與Meta資訊線上管理;可追溯的資料版本管理功能讓開發者能夠視覺化地檢視資料版本迭代的情況,同時還可以檢視歷史版本資料,讓資料的每次變更都可追溯;資料協同功能可基於角色的許可權管理,使開發者更加安全地同步與分享資料,避免資料的反覆複製與遷移,提升團隊的協作效率。
崔運凱告訴創業邦:“我們的資料工具平臺有著非常好的適用性,幾乎任何一個領域的AI開發者都可以利用我們的工具來提高開發效率,進而迭代產品。”
除此之外,格物鈦也重視AI開發者生態社群的建立。透過收集全球範圍內的高質量公開資料集,格物鈦可以為開發者提供自動駕駛、新零售、影片直播、醫療、智慧製造等場景下的多樣標註型別的資料資源,以賦能AI開發者更好地應對人工智慧領域全新商業形態所帶來的資料挑戰。
如今,網際網路發展已經開始了資料定義軟體的階段,在這樣的趨勢下,格物鈦的資料平臺及相應產品不僅在幫助開發者更好地管理和使用資料,更實在推動整個AI產業朝著資料定義的方向發展。
目前格物鈦擁有員工60餘人,由於資料集的使用趨向於免費,格物鈦主要業務增長點將由即將上線的TensorBay資料管理SaaS平臺產生,屆時客戶可以透過支付年費的方式進行使用,同時根據管理的資料量大小和使用者使用情況的區別,客戶的具體使用成本也會有一定的差異。
融資方面,格物鈦在成立之初就獲得了千萬美元級Pre-A輪融資,投資方為紅杉中國種子基金、雲啟資本、真格基金以及風和資本。據瞭解,格物鈦目前新一輪的融資計劃也已經啟動。
本文文章圖片來源於格物鈦,經授權使用。本文為創業邦原創,未經授權不得轉載,否則創業邦將保留向其追究法律責任的權利。如需轉載或有任何疑問,請聯絡[email protected]。