HBO大火科幻劇《西部世界》第三季在已經落下帷幕。《西部世界》講述了一個在AI機器人主題公園中,機器人接待員有了自主意識和思維進而覺醒、反抗人類的故事,同樣《西部世界》也是一部浩大的人工智慧“養成記”,機器人們一次又一次的按照人類設計好的故事陷入悲情的迴圈,最終擺脫“人工”衍生出了真正的“智慧”。
人工智慧需要被人為教導訓練而成。在《西部世界》裡如此,在現實世界同樣如此。6月23日-6月24日,第四屆世界智慧大會在天津舉辦,主題是“智慧新時代:創新、賦能、生態”,會議期間,各類人工智慧企業競相亮相。這些人工智慧所需要的教導和“教材”,背後是由大量的訓練資料訓練而成。在人工智慧不斷升溫的當下,需要更多優質的AI資料實現人工智慧與時俱進的進化。所以我們看到,AI的發展催生了資料標註這樣的新產業,並隨著人工智慧應用落地的實現不斷向著高精尖、高質量發展。
人工智慧不是“人工+智慧”,是“資料+智慧”
作為當今世界上最重要的科技之一,人工智慧走過了60年“三起兩落”的發展歷程,已融入人們生產生活的各個方面。“智慧+”時代,構建應用場景、找準突破口成為人工智慧應用落地的重中之重。
這個突破口,就是AI資料。現在的人工智慧,本質是機器學習,資料是AI界最根本的競爭。AI依據大量有效資料總結規律形成“智慧”,進而在不同場景下落地應用。正如雲測資料總經理賈宇航所說,“其實AI資料作為生產資料,是推動整個AI行業發展的必要一環,也是人工智慧商業化的主要驅動力之一,說高質量的資料決定了AI的落地程度也不為過。”
小到智慧手機人臉解鎖,大到智慧城市的智慧安防,從車輛自動駕駛到AI聊天機器人,從醫學成像與診斷到農作物監測,AI資料正在發揮著愈加重要的作用。人工智慧若要進行應用落地,就必須利用AI資料進行迭代最佳化。
目前,場景化AI資料是人工智慧現階段發展和商業化落地的關鍵點。但機器並不能理解人類所能識別的原始資料,這些原始資料需要人為的“標籤化”以後,才可以被用於模型訓練。這些“標籤化”的資料越多越精準,其獲得的結果就越準確。例如,自動駕駛的演算法模型經過大量場景AI資料的訓練,不斷的學習和最佳化,進而讓系統的智慧化程度逐漸提高。
AI提速,資料標註行業應場景化、精細化發展
AI資料是人工智慧的燃料,AI資料的精準與否直接決定了人工智慧在新零售、智慧駕駛、智慧安防、智慧家居等相關領域的落地應用。
前文有說到,對人工智慧演算法來說“標籤化”的資料才有意義。如何“標籤化”就涉及到“資料標註”這一環節,即針對語音、影象、文字等資料,透過貼標籤、做記號、標顏色或劃重點的方式,來標註出其中目標資料的不同點、相似點或類別。
資料標註,是將資料轉化為AI商業價值的重要一環。資料標註的精準度越高,AI學習和產出的結果越精確,AI也就越智慧。也由此,催生出了資料標註這一新興產業。Testin雲測旗下AI資料服務品牌“雲測資料”正是在這一浪潮下發展起來的,是業內為數不多的對資料準確性、資料類別、資料安全性等都要求極高的AI資料服務商,這也是目前人工智慧行業發展所迫切需要的。
在雲測資料看來,AI最終是為了落地、為了被使用,所以對於AI所需的資料質量要求會更高更精準,甚至還會有更多的定製化場景下的AI資料需求。在提高資料安全與隱私保護之外,保證資料的唯一性、場景化,才能真正幫助企業打造資料核心壁壘,大幅度推動AI進一步落地,這也是雲測資料對自己的角色定位。
場景化,意味資料標註行業要滿足多樣化應用場景標註需求。以計算機視覺領域為例,目前雲測資料資料標註服務能力覆蓋自動駕駛、無人機、智慧教育、智慧金融、工業機器人、新零售、安全防護等場景。
不同領域的不同場景需求,都有自己的資料型別與具體標註要求,因此極為考驗AI資料服務商的場景化服務能力和專業領域知識能力。
例如,在金融行業,早期對AI客服機器人的要求只停留在“使用者提問後,對其中的關鍵詞進行提取,並按照既定話術回答”,這時期人工客服才是回答使用者提問的主力軍,客服機器人只是配角。但是在網際網路金融業務競爭異常激烈的今天,越來越多的使用者習慣在網上辦理業務,AI客服機器人正在大規模地取代人工客服,AI問答的準確性將直接決定業務的效率和成本,並影響使用者體驗,很大程度上決定了金融機構的競爭力。
此外,隨著AI與各個產業結合的愈加緊密,AI商業化程度進入新的高度,企業對AI在商業化落地中的表現要求越來越高。為了保證AI演算法的識別精度,AI資料的質量也就變得至關重要。
場景化+高質量+安全,雲測資料助力AI商業化落地
巨大的使用者規模產生的海量資料是我國發展人工智慧的優勢,隨著人工智產業規模的進一步擴大,迫切需要更精準、場景化的高標準資料訓練推動人工智慧落地。雲測資料自成立以來,就致力於為AI場景化落地提供高質量資料支撐,與眾多業內領先企業建立了良好持久的合作關係。覆蓋行業包括智慧城市、智慧家居、智慧駕駛、智慧金融、新零售等領域,包含網際網路企業、科技企業和眾多智慧化轉型的傳統企業。
在保證生產效率這一點上,雲測資料十分強調作業協同化。在AI資料生產中,雲測資料設計了從建立任務、分配任務、標註流轉、到質檢/抽檢環節和最後的驗收等更完善的管理流程,每個環節有相應專業人員來把控資料標註的質量和時間節點,進行好上下游工作環節銜接,得以在保證質量的前提下可以真正提高效率。
在場景化資料交付方面,雲測資料透過自建實驗室和資料標註基地,為智慧駕駛、智慧城市、智慧家居、智慧金融、新零售等眾多領域提供高質量的資料採集、資料標註服務,全方位支援文字、語音、影象、影片等各型別資料的處理。截止目前,雲測資料在華東、華北、華南均設有資料交付中心和資料場景實驗室,已成功為眾多企業提供AI資料服務。
同時,雲測資料一直將AI資料隱私安全放在業務開展的首要地位,在保障AI資料隱私性、安全性方面,雲測資料三管齊下。在資料採集之前,雲測資料會與所有資料採集的使用者都簽訂資料授權協議,確保AI企業用於訓練的資料合法合規;同時,在AI資料合格交付後從不留底,堅持資料絕不復用的核心原則。此外,雲測資料從防火牆的設定、內部資訊系統的管護到標準化的流程作業體系都建立了確切的資料保障機制,力圖做到步步保護、層層把關。
隨著“新基建“建設加速,AI行業將高速發展,AI運用落地,又加速AI資料這樣新興行業的興起。作為資料標註行業領頭羊,雲測資料也迎來了空前的發展機遇,將順勢而為推動AI行業向更高質量發展。