「覺醒向量」打造標準化資料標註系統,為AI海量資料應用鋪路

根據上下游關係,人工智慧產業鏈條主要有“資料”、“算力”、“演算法”三層。每個人工智慧產品的落地,都需要經過三層的推進,最終實現“計算機視覺”、“語音處理”、“自然語言處理”等具體的應用。

在算力和演算法層面,已經有了諸多的標準化解決方案,譬如百度雲、阿里雲、TensorFlow、飛槳等。然而在“資料”層面,如何準備海量資料,目前行業仍沒有通行的獨立標準化方案。

根據覺醒向量CEO楊洋介紹,目前市面現存資料處理產品,多是系統化人工智慧方案的一部分,而較少有單獨的解決方案。而許多企業則對獨立的資料處理平臺有需求,從而更有針對性地利用成熟的算力+演算法產品,解決相關問題。

成立於2018年3月,覺醒向量專攻AI的資料處理,打造資料處理平臺、助力各類人工智慧方案高效開展。

「覺醒向量」打造標準化資料標註系統,為AI海量資料應用鋪路

LabelHub圖片標註、質檢、驗收介面

目前,在企業自主開發方案過程中,不可避免的會遇到資料準備的難題。資料準備流程包含了篩選、清洗、標註等諸多階段,資料量眾多、步驟繁雜,同時涉及人力上的部門與人員配合,因此現存的解決方案有較大提升空間。

覺醒向量認為,此外現存市場上存在諸多痛點:其一,許多企業對資料保密性要求較高,他們對通用的方案平臺往往存有顧慮。其二,資料準備流程沒有一款標準化平臺提供給需求者,現存的方案較為粗放、效能不足;其三,目前中國市面上,可見的針對資料處理的軟體較少,國產化需求高。

針對上述痛點,覺醒向量提出了TDM系統(Training Data Management,訓練資料管理)的概念,希望利用標準化的平臺,加速行業的資料處理標準化程序,目前旗下已推出了AI資料處理系統LabelHub產品,該產品主要用於資料處理流程中,對專案、對人員的綜合管理。

LabelHub系統能夠實現影象標註、影片標註、3D點雲標註與文字標註等綜合功能。並內含多個模組:在專案管理模組,新建專案並實現實時跟蹤進度,定期生成報告從而及時反饋專案程序;在人員管理模組,根據資料處理要求,指派標註員、稽核員、組長等角色,並統計系統內人員的完成情況、正確率等資訊;在資料管理模組,實現資料集上傳、常見格式匯出。

其中,系統有績效管理、模板管理、標註協作等多項特色功能。績效管理能夠及時統計角色工作完成情況,提供績效的排名,從而加強團隊進度的管理。同時,系統內部集成了諸多模板,依據不同專案選擇合適的模板,從而提升效率。標註協作功能則是覺醒向量平臺提供專業標註團隊,用一支訓練有素的標註隊伍、達成高效標註任務目的。

在業務流程上,由如下步驟展開:

首先,總管理員上傳資料、建立專案,指派人員角色、分配任務、自定義標註模板,並實時監督人員的績效。其次,由資料標註員執行標註任務。接著,質檢員執行質檢,打回不透過的任務。最後總管理員匯出資料,從而給到下一步處理流程。

「覺醒向量」打造標準化資料標註系統,為AI海量資料應用鋪路

LabelHub專案管理介面

針對不同客戶的需求,LabelHub系統可以私有化部署、SaaS、定製化開發三種方式使用。私有化部署業務主要在國內展開,針對企業對隱私顧慮的痛點,將整體方案在客戶企業本地化安裝完成。而SaaS服務則主要面向覺醒向量的海外業務。定製化開發則主要針對有具體要求的企業,按需提供多種功能。

「覺醒向量」打造標準化資料標註系統,為AI海量資料應用鋪路

LabelHub圖片標註、質檢、驗收介面

楊洋介紹,目前LabelHub客戶主要分為人工智慧企業、正在應用人工智慧實現業務提升的傳統企業、智慧化改造整合商三大類。

在汽車領域客戶案例中,某車企自動駕駛研發部門想要實現標註道路圖片中的障礙物、汽車2D框注等功能,並根據其資料安全需求自建了標註團隊。然而在實施過程中,出現了人員效率不足、難以監督績效等問題,同時,由於缺乏工具平臺,圖片分發錯誤時有發生。

而在使用了LabelHub後,管理員使用了週報、月報功能實時監督,團隊整體效率從而得到提升。月產出數量由73萬升至75萬張,同時人員數量由此前的110人減少到80人,整體人力開支降低了36%。

此外,LableHub已經有電力、船舶等大型企業客戶,他們對質檢的視覺人工智慧方案存在需求。由於此類企業體量較大、涉及部門龐雜,旗下的應用場景多,因此涉及資料繁雜而龐大。

LabelHub為他們提供了一個較好的集約化資料處理平臺。同時,很多使用者對於自身資料安全較為重視,因此LabelHub私有化部署的方式能夠給到客戶最大自主權、打消他們對資料安全的顧慮。

據悉,按照三種部署的方式的不同,LabelHub分為一次性部署費用加上後續服務收費,SaaS則按年費制收費。

目前,除了上述舉例多家大企業客戶,總體客戶量也在穩步增長中。在市場分野上,LabelHub計劃將本地化部署主要應用於國內的大企業,而SaaS則主要用於進一步拓展海外市場。楊洋告訴創業邦,公司2020年的營收預計破千萬人民幣。

在團隊上,CEO楊洋畢業於加拿大Ivey商學院,在北美有超過10年的工作經歷,先後就職於Morgan Stanley和加拿大蒙特利爾銀行的投資銀行部門。

CTO易呈曾就職於中科院生態與理化技術研究所,擁有超過10年全站產品開發和管理經理,多次參與國有集團公司系統軟體從0到1開發歷程。

楊洋告訴創業邦,公司目前正在尋求500萬人民幣的天使輪融資,希望在合適時機與對人工智慧有興趣的投資機構合作。

插圖源自覺醒向量,經授權使用。本文為創業邦原創,未經授權不得轉載,否則創業邦將保留向其追究法律責任的權利。如需轉載或有任何疑問,請聯絡[email protected]

版權宣告:本文源自 網路, 於,由 楠木軒 整理釋出,共 2224 字。

轉載請註明: 「覺醒向量」打造標準化資料標註系統,為AI海量資料應用鋪路 - 楠木軒