楠木軒

「覺醒向量」打造標準化數據標註系統,為AI海量數據應用鋪路

由 秋長紅 發佈於 科技

根據上下游關係,人工智能產業鏈條主要有“數據”、“算力”、“算法”三層。每個人工智能產品的落地,都需要經過三層的推進,最終實現“計算機視覺”、“語音處理”、“自然語言處理”等具體的應用。

在算力和算法層面,已經有了諸多的標準化解決方案,譬如百度雲、阿里雲、TensorFlow、飛槳等。然而在“數據”層面,如何準備海量數據,目前行業仍沒有通行的獨立標準化方案。

根據覺醒向量CEO楊洋介紹,目前市面現存數據處理產品,多是系統化人工智能方案的一部分,而較少有單獨的解決方案。而許多企業則對獨立的數據處理平台有需求,從而更有針對性地利用成熟的算力+算法產品,解決相關問題。

成立於2018年3月,覺醒向量專攻AI的數據處理,打造數據處理平台、助力各類人工智能方案高效開展。

LabelHub圖片標註、質檢、驗收界面

目前,在企業自主開發方案過程中,不可避免的會遇到數據準備的難題。數據準備流程包含了篩選、清洗、標註等諸多階段,數據量眾多、步驟繁雜,同時涉及人力上的部門與人員配合,因此現存的解決方案有較大提升空間。

覺醒向量認為,此外現存市場上存在諸多痛點:其一,許多企業對數據保密性要求較高,他們對通用的方案平台往往存有顧慮。其二,數據準備流程沒有一款標準化平台提供給需求者,現存的方案較為粗放、效能不足;其三,目前中國市面上,可見的針對數據處理的軟件較少,國產化需求高。

針對上述痛點,覺醒向量提出了TDM系統(Training Data Management,訓練數據管理)的概念,希望利用標準化的平台,加速行業的數據處理標準化進程,目前旗下已推出了AI數據處理系統LabelHub產品,該產品主要用於數據處理流程中,對項目、對人員的綜合管理。

LabelHub系統能夠實現圖像標註、視頻標註、3D點雲標註與文本標註等綜合功能。並內含多個模塊:在項目管理模塊,新建項目並實現實時跟蹤進度,定期生成報告從而及時反饋項目進程;在人員管理模塊,根據數據處理要求,指派標註員、審核員、組長等角色,並統計系統內人員的完成情況、正確率等信息;在數據管理模塊,實現數據集上傳、常見格式導出。

其中,系統有績效管理、模板管理、標註協作等多項特色功能。績效管理能夠及時統計角色工作完成情況,提供績效的排名,從而加強團隊進度的管理。同時,系統內部集成了諸多模板,依據不同項目選擇合適的模板,從而提升效率。標註協作功能則是覺醒向量平台提供專業標註團隊,用一支訓練有素的標註隊伍、達成高效標註任務目的。

在業務流程上,由如下步驟展開:

首先,總管理員上傳數據、創建項目,指派人員角色、分配任務、自定義標註模板,並實時監督人員的績效。其次,由數據標註員執行標註任務。接着,質檢員執行質檢,打回不通過的任務。最後總管理員導出數據,從而給到下一步處理流程。

LabelHub項目管理界面

針對不同客户的需求,LabelHub系統可以私有化部署、SaaS、定製化開發三種方式使用。私有化部署業務主要在國內展開,針對企業對隱私顧慮的痛點,將整體方案在客户企業本地化安裝完成。而SaaS服務則主要面向覺醒向量的海外業務。定製化開發則主要針對有具體要求的企業,按需提供多種功能。

LabelHub圖片標註、質檢、驗收界面

楊洋介紹,目前LabelHub客户主要分為人工智能企業、正在應用人工智能實現業務提升的傳統企業、智能化改造集成商三大類。

在汽車領域客户案例中,某車企自動駕駛研發部門想要實現標註道路圖片中的障礙物、汽車2D框注等功能,並根據其數據安全需求自建了標註團隊。然而在實施過程中,出現了人員效率不足、難以監督績效等問題,同時,由於缺乏工具平台,圖片分發錯誤時有發生。

而在使用了LabelHub後,管理員使用了週報、月報功能實時監督,團隊整體效率從而得到提升。月產出數量由73萬升至75萬張,同時人員數量由此前的110人減少到80人,整體人力開支降低了36%。

此外,LableHub已經有電力、船舶等大型企業客户,他們對質檢的視覺人工智能方案存在需求。由於此類企業體量較大、涉及部門龐雜,旗下的應用場景多,因此涉及數據繁雜而龐大。

LabelHub為他們提供了一個較好的集約化數據處理平台。同時,很多用户對於自身數據安全較為重視,因此LabelHub私有化部署的方式能夠給到客户最大自主權、打消他們對數據安全的顧慮。

據悉,按照三種部署的方式的不同,LabelHub分為一次性部署費用加上後續服務收費,SaaS則按年費制收費。

目前,除了上述舉例多家大企業客户,總體客户量也在穩步增長中。在市場分野上,LabelHub計劃將本地化部署主要應用於國內的大企業,而SaaS則主要用於進一步拓展海外市場。楊洋告訴創業邦,公司2020年的營收預計破千萬人民幣。

在團隊上,CEO楊洋畢業於加拿大Ivey商學院,在北美有超過10年的工作經歷,先後就職於Morgan Stanley和加拿大蒙特利爾銀行的投資銀行部門。

CTO易呈曾就職於中科院生態與理化技術研究所,擁有超過10年全站產品開發和管理經理,多次參與國有集團公司系統軟件從0到1開發歷程。

楊洋告訴創業邦,公司目前正在尋求500萬人民幣的天使輪融資,希望在合適時機與對人工智能有興趣的投資機構合作。

插圖源自覺醒向量,經授權使用。本文為創業邦原創,未經授權不得轉載,否則創業邦將保留向其追究法律責任的權利。如需轉載或有任何疑問,請聯繫editor@cyzone.cn。