科大訊飛DCASE挑戰賽奪冠,“A.I.+工業”前景廣闊

  南方網訊 (記者/陳偉峯)近日,科大訊飛A.I.研究院聯合中科大語音及語言信息處理國家工程實驗室(USTC-NELSLIP)在聲音事件定位與檢測(Sound Event Localization and Detection,Task 3)任務中摘得桂冠。

  在DCASE 2020挑戰賽的Task3任務中,科大訊飛-中科大聯合團隊脱穎而出,在聲音事件檢測F-score、檢測錯誤率、定位錯誤率三項指標中均取得較大優勢並最終奪冠。

科大訊飛DCASE挑戰賽奪冠,“A.I.+工業”前景廣闊

科大訊飛A.I.研究院聯合中科大語音及語言信息處理國家工程實驗室(USTC-NELSLIP)在Task3任務中奪冠(截圖來源:DCASE挑戰賽官方網站)

  這意味着,科大訊飛在人工智能領域尤其是聲音定位與檢測技術上又有了長足進展,這也為實現“聲學照相機”和“工業聽診器”等“A.I.+工業”的應用場景落地提供了強而有力的技術支撐。

  攻克兩大難關奪得冠軍

  DCASE挑戰賽是由IEEE(Institute of Electrical and Electronics Engineers)舉辦的聲音場景識別和事件檢測競賽,自2013年組織發起以來,至今已舉辦了六屆,是目前聲音事件領域最權威的競賽。

  本屆DCASE 2020挑戰賽,共設置了六個任務,吸引了包括亞馬遜、英特爾、三星、索尼等國際公司和清華大學、新加坡南洋理工大學、香港中文大學、英國薩里大學等頂級高校在內的共138支隊伍、473個有效系統參賽。

  本次科大訊飛-中科大聯合團隊參加的聲音事件定位與檢測任務(Task 3)要求對一段音頻內發生的聲音事件進行準確的時間點檢測、事件類型分類與方位角定位。

  這就要求系統不僅要檢測出每一幀的聲音,還需要給出對應聲音的空間位置。如下圖,在1秒到3秒檢測到鋼琴聲,位於水平角15°、高度角20°處。

  這個任務的最大難點在於聲源的位置是快速變化的,並且存在很多相似聲音,比如敲門聲與腳步聲、警報聲與手機鈴聲等,還伴有一定的混響與噪聲。

科大訊飛DCASE挑戰賽奪冠,“A.I.+工業”前景廣闊

(Task 3任務中科大訊飛-中科大聯合團隊對聲音事件的檢測結果)

  面對這一難題,科大訊飛和中科大聯合團隊拿出了兩個“殺手鐧”:一個是“聲音事件空間位置仿真算法”,通過模擬不同空間位置的聲音,訓練模型,提升深度學習模型對聲音空間位置的適應能力,從而讓模型具備舉一反三的能力;另一個是“序列區分性訓練法”,通過對相似聲音事件進行更精細化的建模,有效提升了易混淆聲音事件的檢測準確率。

  比賽結果顯示,聯合團隊在檢測“有沒有聲音”(聲音事件檢測F-score)、“有什麼樣的聲音”(檢測錯誤率)、“聲音在哪個方位”(定位錯誤率)這三項指標上獲得優秀成績,並最終奪冠。

  “工業聽診”應用前景廣闊

  有了A.I.,工業界的“醫生”也能隨時隨地為機器“望聞問切”,通過機器發出的聲音辨別機器是否質量合格、是否可以正常工作。聲音定位與檢測技術日趨成熟,也為行業帶來廣闊的應用前景。

  基於領先的聲音事件定位和檢測技術,科大訊飛已經研發出“聲學照相機”和“工業聽診器”等產品,並陸續在電力、水利、軌道交通、汽車製造等行業領域發揮效用。

  其中,訊飛聲學照相機可以利用高精度麥克風陣列技術定位聲源位置,再配合攝像頭,實現可以直接在設備上看到聲源位置,方便工作人員的日常設備檢修。目前,訊飛聲學照相機已陸續在國內多個地區、項目中進行試點和應用。

科大訊飛DCASE挑戰賽奪冠,“A.I.+工業”前景廣闊

工作人員手持訊飛聲學照相機對變電站絕緣子做檢測,距離地面高度約10m。檢測結論:圖示絕緣子的檢測指標在指定區間範圍內,即正常運行,不存在放電等異常情況。

科大訊飛DCASE挑戰賽奪冠,“A.I.+工業”前景廣闊

(訊飛聲學照相機應用場景圖)

  此外,依託聲音定位和檢測技術,訊飛工業聽診系統可實現實時檢測設備聲音,避免設備故障導致生產中斷,還可通過聲音監測產品質量,避免不良品流向市場。

科大訊飛DCASE挑戰賽奪冠,“A.I.+工業”前景廣闊

(訊飛工業聽診系統應用場景圖)

  持續深耕核心源頭技術創新

  2018年至今,科大訊飛已獲得26項人工智能國際競賽的冠軍,涵蓋語音識別、語音合成、機器閲讀理解、手勢識別、圖像識別等諸多領域。在2020年,科大訊飛在人工智能國際賽場上也捷報頻傳。

  1月17日,在德國The 20BN-Jester Dataset手勢識別評測中科大訊飛以97.26%的準確率斬獲冠軍,並刷新世界紀錄;

  5月4日,科大訊飛和中科大聯合團隊再次奪得第六屆國際多通道語音分離和識別大賽(CHiME-6)中給定説話人邊界的多通道語音識別兩個參賽任務上的冠軍,打破自身紀錄,取得三連冠。

  5月21日,哈工大訊飛聯合實驗室與河北省訊飛人工智能研究院聯合團隊再次在多步推理閲讀理解評測HotpotQA全維基賽道中奪冠。

  未來,科大訊飛將繼續堅持核心源頭技術研發創新,用A.I.賦能各行各業,讓機器能聽會説,能理解會思考,用人工智能建設美好世界。

版權聲明:本文源自 網絡, 於,由 楠木軒 整理發佈,共 2006 字。

轉載請註明: 科大訊飛DCASE挑戰賽奪冠,“A.I.+工業”前景廣闊 - 楠木軒