雖然説AI不是數據的堆砌,但是AI的背後的確是數據的功勞。不然,我們居家必備的小愛同學、天貓精靈們怎麼聽得懂我們的話?
尤其是今年國家不提GDP增長目標但極力推進高質量發展的背景下,追求更加精準的AI落地成為行業共識。
這意味着,AI數據質量需要進一步提升。
9月6日,在吸引了1.8萬家境內外企業的服貿會上(全稱是2020中國國際服務貿易交易會),雲測數據首次發佈了一項數據標註領域的重要成果:雲測數據項目最高交付精準度達到了99.99%——這是目前數據標註領域可達到的最高服務標準。
在數據標註行業,交付精度達到99.99%是什麼概念呢?
一般來説,在AI行業,算力、算法、數據是三大要素,前兩者是設備與能力,數據則是讓AI學習的知識素材。
AI數據服務,包含了為AI算法、算力訓練及優化提供的數據採集、清洗、信息抽取、標註等服務,以採集和標註為主。
而AI就是通過大批量基於特定標註規則後學習的方法論,因此需要人工將像素、語音信號、文本內容轉換為機器能理解、能看懂的數據內容,才可以被機器習得識別處理的方法論。
這些被標註的結果為識別人的特徵點,在臉上打上一個個特殊標記,為識別圖像中的車輛,通過標註框的方式將對應像素位置範圍框選其中。
因此,數據標註的精準度提升,AI才不會把汽車識別為房子,把老虎識別為獅子。在AI越來越強調落地各個產業的今天,數據標註精準度是把控AI質量的關鍵。
雲測數據總經理賈宇航表示,進行99.99%的成果展示,也是向外傳遞數據標註高質量發展信心。
雲測數據是什麼公司?
行業內人士可能都知道Testin雲測,成立於2011年,是一家以人工智能技術驅動的企業服務平台。實際上,雲測數據正是Testin雲測旗下AI數據標註服務品牌,是主打高質量AI數據服務的服務商,是算法廠商的上游,圖像、語音、文本的數據類型都做到了全品類支持。
雷鋒網注意到,之所以他們有底氣向行業展示出4個9的精準度,雲測數據總經理賈宇航給出的理由在於:雲測數據具備全品類的高效標註平台,已經完成了標準化API接口的流程嵌入,做到了模板化的任務創建,並支持了不同種類標註類型和標註方法。
此外,其工作平台包含項目管理、環節工具、標註平台,雲測數據所沉澱的是完全自主知識產品的平台技術。
值得一提的是,相比外包的數據標註業務,雲測數據自建了數據交付中心以及自有員工,人員穩定。截至目前,雲測數據在華東、華北、華南設有數據交付中心和數據採集基地。
對於場景數據的把控和處理,正成為新競爭格局下的硬實力。
雷鋒網瞭解到,雲測數據可能更偏向在智能駕駛、智慧城市、智能家居、智慧金融、新零售等場景的AI數據服務。
以自動駕駛為例,在實際落地中,為對物體測距及測速更加精準,引入激光雷達傳感器。車載攝像頭中的數據與我們人眼相差無幾,而激光雷達產生數據與人類所認知的現實世界差距甚遠。
據悉,完成激光雷達的相關3D點雲數據標註工作,背後需要標註人員對3D點雲數據有豐富的處理經驗。雲測數據在工具層面採用融合標註方式,讓標註人員更加直觀的將兩個世界維度的數據融合一起判斷,提高了標註人員的數據處理精準度,同時加快了標註效率。
整體來看,國內的AI發展態勢良好,場景化AI數據服務趨勢凸顯,且AI公司把自己快“逼”上落地極限了,與場景緊密捆綁的數據標註都將迎來發展熱潮。
伴隨着5G的落地,更多豐富的場景也將井噴,AI行業數千億的蛋糕,將成為今天企業走向未來的新動力。(雷鋒網雷鋒網)