楠木軒

給AI當老師

由 完顏翠琴 發佈於 科技

自動駕駛技術、智能服務工作台、CT影像分析診斷系統……近年來,人工智能(AI)技術應用讓人們的工作效率大大提升,而這背後離不開人工智能訓練師的默默奉獻。

日前,人力資源社會保障部與國家市場監管總局、國家統計局聯合向社會發布了16個新職業,人工智能訓練師名列其中。阿里巴巴集團調研數據顯示,預計到2022年,人工智能訓練師國內外相關從業人數有望達到500萬,大量人才缺口亟待滿足。

助力AI智慧成長

在北京市房山區互聯網金融安全示範產業園內,一節為自動駕駛系統量身定製的“課程”正在進行。通過數據標註工具,24歲的人工智能訓練師劉雪將圖片中一輛巴士用矩形框圈出,並給這個框打上“巴士”的標籤,然後繼續在圖像上標記其他車輛、交通標誌及自行車等物體。

“這些打好標籤的圖片、文字和聲音等數據將會成為自動駕駛系統的學習材料,幫助人工智能算法學習識別道路中影響車輛行駛的實體。”作為人工智能訓練師,劉雪並沒有參與自動駕駛系統的開發工作,但後期大量的數據標註為系統運行打下了堅實基礎。

“相較於人工智能開發者,人工智能訓練師的工作更加偏向產品的實際使用過程。”海南省區塊鏈產業研究院專委副主任、海南大學教授段玉聰介紹説,人工智能訓練師利用智能訓練軟件,對實際使用中的AI產品進行數據庫管理、算法參數設置、人機交互設計、性能測試跟蹤及其他輔助作業。

換言之,設計之初的AI產品就像剛入學的孩子,人工智能訓練師需要根據產品預設的不同落地場景“因材施教”,通過不斷地培養和訓練幫助AI產品“長大成人”,讓其有足夠的智慧應對實際應用場景中的各種問題。

除了訓練和培養AI,人工智能訓練師前期還需要對AI學習的材料進行加工,即通過數據篩選得到結構化的核心知識和關鍵數據,以特定的數據標註規則將數據“喂”給AI並進行“訓練”,同時根據其反饋不斷調整參數優化算法,讓AI更好地為人類服務。

高效服務抗擊疫情

新冠肺炎疫情期間,人工智能訓練師和AI技術在防疫抗疫、生活出行等方面展現了高效的服務能力。

在抗疫前線,AI技術被大規模應用在病人CT影像的分析診斷中。基於先期大量確診病例和疑似病例的影像特徵數據,人工智能訓練師幫助人工智能系統學習分辨新冠肺炎案例與流感等其他患者CT影像特徵的區別,從而實現快速分診,有效阻斷了傳染源和降低交叉感染風險。

數坤科技首席執行官馬春娥表示,該診斷系統已在全國近百家醫院上線使用,敏感性超過95%。未來將通過人工智能跨學科、多模態的綜合學習,對復陽病例、無症狀感染者、新冠肺炎合併其他基礎性疾病等特殊人羣進一步研究,為精準防治提供科學支撐。

重慶市沙坪壩區則通過智能外呼系統進行“無接觸式”防疫摸排,向居民瞭解是否有發熱等不適症狀、是否從外返回復工等問題。基於疫情信息和預先學習,系統可在在最短時間內自動識別出疑似患者和需要接受隔離檢疫的人員。“16.8萬份數據若由人工分析需要半個月,AI只用了約4小時。”沙坪壩區政法委辦公室主任劉毅介紹,智能外呼系統每分鐘可撥打3500個電話,大大提高了摸排效率。

在人工智能訓練師的幫助下,智能外呼系統還順利接入各大鐵路航空票務系統,讓全國230萬受疫情影響旅客的票務出行問題得到及時解決。此外,阿里巴巴客户體驗事業羣的人工智能訓練師僅用22小時便實現健康智能服務工作台落地,滿足了不斷增長的在線健康問診需求,服務效率大大提升。

人才缺口亟待滿足

“我被分配在‘3D語義分割’小組給圖片信息做標註。”去年,在外打工的小陳回到貴州老家接受企業培訓,開啓了人工智能訓練師的生涯。小陳説,雖然自己對“人工智能”毫無概念,但好在學過的計算機知識派上用場,感覺這活兒不難。

隨着AI產業的發展,越來越多的業務人員“跨界”當起了人工智能訓練師。阿里人工智能訓練專家王智宇介紹説,業務人員轉型人工智能訓練師的核心競爭力就是其對業務的理解能力。“我們可以教會他智能訓練和數據分析的思路,但無法教會他對業務本身的理解能力。”

針對不斷擴大的人才缺口,整個AI行業都開始着手培養自己的人工智能訓練師。不過在國內近50萬人工智能訓練師從業者中,從事數據標註等簡單任務的人員卻佔了絕大多數。而在分析提煉專業領域特徵,訓練和評測人工智能產品相關算法、功能和性能,以及設計人工智能產品的交互流程和應用解決方案等方面具有相關知識和從業經驗的人員卻是“鳳毛麟角”。

“人工智能訓練師需要不斷學習,提升自己的綜合素質。”段玉聰分析稱,AI行業在短期內對數據標註員仍有大量需求,但隨着無監督自我學習算法的興起,AI對數據的依賴性將減輕,人工智能訓練師的工作重點也將發生變化,偏向AI算法測試等技術型人才缺口將更加突出。

專家表示,如果人工智能訓練師能系統地積累經驗,把感性經驗總結為理性的認識,通過不斷持續練習,總結出更深層的原理,進一步提升創造性,在職場上會更有競爭力。