隨着社會的發展,人工智能已經滲透到了各行各業,並與人們的日常生活緊密結合。人工智能產業也愈加細分、完善,無論是上游的芯片供應商、設備供應商、數據服務提供商,還是下游的算法開發團隊、集成商等,產業生態已經被建立並且仍在不斷髮展。
需要注意的一點是,隨着人工智能產業的發展以及物聯網、大數據技術的普及,以文本、圖形、圖像、音頻、視頻等非結構化數據為主的信息急劇增加,面對如此巨大的信息海洋,特別是非結構化數據信息,如何存儲、查詢、分析、挖掘和利用這些海量信息資源就顯得尤為關鍵。
對於智能系統/應用的開發者來説,其面臨的數據環境越來越龐雜,也越來越無法利用傳統手段來對數據進行管理和使用。
“我本身就是做技術出身,深刻體會到了在目前的AI數據環境下開發者所面臨的問題。”格物鈦創始人崔運凱對創業邦説道。崔運凱先後畢業於上海交通大學和美國賓夕法尼亞大學,曾任賓夕法尼亞大學助理研究員。2015年,崔運凱作為早期員工加入Uber自動駕駛部門,成為該部門最年輕的技術經理,並在2018年回國後加入維智科技(Wayz.ai)擔任合夥人。
2019年,崔運凱與來自Snapchat、依圖等知名企業的合夥人創建了格物鈦,並致力於將其打造為一家優秀的AI數據服務平台提供商,目前格物鈦可以向開發者提供針對非結構化數據存儲、標註、模型訓練和管理預測的一站式AI服務平台產品,能夠有效降低AI開發過程中因處理非結構化數據帶來的不斷增長的數據獲取、存儲和處理成本,加速AI開發流程和產品創新。
面對指數級增長的AI數據,開發者的處理手段並沒有得到及時的更新。目前,一家人工智能企業的大量非結構化數據仍在以文件的方式儲存在文件管理系統中,開發者在對數據進行操作或使用時,通常要建立文件夾,然後找到所需要的數據進行手動複製並重新命名,這是一項耗時耗力但幾乎毫無價值的工作流程。
此外,開發者也無法快速而準確地找到對本次開發有價值的數據片段,尤其在面對視頻數據時,開發者甚至要通過企業的兼職人員來協助查看視頻文件並找到相應的視頻片段。可以説在人工智能產業如火如荼的今天,開發者手中的工具軟件卻仍然非常原始。
“我們做產品的本質,就是希望幫助AI開發者更高效地迭代模型,而不是將精力耗費在管理數據的工作上。”崔運凱告訴創業邦。
基於這樣的市場需求,格物鈦打造了TensorBay數據管理SaaS平台,專為算法工程師提供非結構化數據集管理服務。TensorBay平台集數據託管、數據集版本管理、數據可視化和開發者工具等多種功能於一體,可為算法訓練提供快速的效率提升解決方案,幫助開發者高效地獲取、加工和管理數據,並通過協同功能開展模型訓練,助力企業快速、低成本地實現AI技術導入和算法模型迭代。
具體來説,TensorBay平台的雲端數據託管功能支持多種格式、多樣場景與多種行業的數據託管,以及原始數據、標註數據與Meta信息在線管理;可追溯的數據版本管理功能讓開發者能夠可視化地查看數據版本迭代的情況,同時還可以查看歷史版本數據,讓數據的每次變更都可追溯;數據協同功能可基於角色的權限管理,使開發者更加安全地同步與分享數據,避免數據的反覆複製與遷移,提升團隊的協作效率。
崔運凱告訴創業邦:“我們的數據工具平台有着非常好的適用性,幾乎任何一個領域的AI開發者都可以利用我們的工具來提高開發效率,進而迭代產品。”
除此之外,格物鈦也重視AI開發者生態社區的建立。通過收集全球範圍內的高質量公開數據集,格物鈦可以為開發者提供自動駕駛、新零售、視頻直播、醫療、智能製造等場景下的多樣標註類型的數據資源,以賦能AI開發者更好地應對人工智能領域全新商業形態所帶來的數據挑戰。
如今,互聯網發展已經開始了數據定義軟件的階段,在這樣的趨勢下,格物鈦的數據平台及相應產品不僅在幫助開發者更好地管理和使用數據,更實在推動整個AI產業朝着數據定義的方向發展。
目前格物鈦擁有員工60餘人,由於數據集的使用趨向於免費,格物鈦主要業務增長點將由即將上線的TensorBay數據管理SaaS平台產生,屆時客户可以通過支付年費的方式進行使用,同時根據管理的數據量大小和用户使用情況的區別,客户的具體使用成本也會有一定的差異。
融資方面,格物鈦在成立之初就獲得了千萬美元級Pre-A輪融資,投資方為紅杉中國種子基金、雲啓資本、真格基金以及風和資本。據瞭解,格物鈦目前新一輪的融資計劃也已經啓動。
本文文章圖片來源於格物鈦,經授權使用。本文為創業邦原創,未經授權不得轉載,否則創業邦將保留向其追究法律責任的權利。如需轉載或有任何疑問,請聯繫[email protected]。