新華社北京2月17日新媒體專電 《日本經濟新聞》近日發表題為《AI同聲傳譯將達專家級水平》的報道稱,日本研發人員正在研究如何讓AI對發言者的講話“隨聽隨翻”。技術的關鍵在於掌握預處理技術,對語句進行合理分割。若能利用AI同傳將日語順利譯為其他世界主要語言,日本將在國際上佔據優勢。
科學家希望2025年能夠利用人工智能實現實時同聲傳譯。現階段語音識別技術已較為完備,未來的目標是提高翻譯精度和速度。世界上許多語言與日語具有相同特徵,若日語同聲傳譯技術能夠實現,其國際前景可能非常廣闊。
台上演講者用英語演講1分鐘,AI可隨即將日語譯文顯示在其背後的屏幕上。這正是2020年11月日本情報通信研究機構(NICT)發佈會上的一幕。從發言到形成譯文僅需要大約10秒,而且譯文幾乎沒有錯誤。
一般而言,同聲傳譯需要通過語音識別技術識別講話內容,再通過應用了AI等技術的翻譯軟件將其轉換成其他語言。現有的機器同傳多是等發言者話畢才開始翻譯,這樣就難以保證同傳的順暢。因為同兩位直接用母語交流的人相比,機器同傳需要耗費兩倍的時間。此種模式難以應用於商業談判,需要發展新技術來克服其弊端。
NICT在2019年度之前的國家研究項目中,已經將語音識別技術發展至一定高度。2020年度開始,他們將目標定為提高翻譯的精度和速度。將來可望將時差控制在兩三秒內,達到真人同聲傳譯水平。
研發人員正在研究如何讓AI對發言者的講話“隨聽隨翻”。技術的關鍵在於掌握預處理技術,對語句進行合理分割。
翻譯軟件主要包括分割語句的預處理技術和翻譯引擎兩大核心技術。現有技術為保證準確只能在整句話結束後開始翻譯,這樣就導致時間間隔過長。如果能在一句話結束之前開始翻譯就能大大縮短等待時間。
NICT將意羣分割法應用於預處理技術中,實現了較以往的逐句翻譯更加精準的譯法,與同傳譯員的實際工作方法相同。這樣,在保證翻譯精度的同時也縮短了受眾等待時間。
AI同聲傳譯的研發過程需要用到大量數據。NICT將向同傳譯員採集其意羣分割習慣以及實際形成的譯文,該項工作將一直持續至2021年度結束。預計將於2022年度研發使用意羣分割法的AI翻譯技術。
相比英譯日,日譯英的同傳難度更高。原因在於對日語語句進行預處理分割的難度較大。
日語將動詞和否定等重要信息放在句尾,所以需要對整句進行預覽後才能翻譯。相比之下,英語中此類信息的句中位置更加靠前,所以易於翻譯。而且日語經常省略主語,AI在補足主語時容易出現錯誤。
為防止出現誤譯,AI還需要具備校準能力。例如,如果事先向AI輸入演講內容相關數據,讓其進行自我學習,它就可以做到對內容的整體把握,提高同傳準確率。
翻譯引擎也將得到改良。這是一項應用廣泛、不僅限於日英互譯的技術,會大大影響翻譯精度。如果翻譯引擎達不到要求,即便預處理再快、校準功能再強大也無濟於事。
除了市售手機翻譯機,NICT翻譯引擎還被應用於松下、NTT都科摩和NEC等公司的語音翻譯服務中。NICT研究員隅天英一郎極具信心地表示,該公司的翻譯引擎精度能夠達到託業900分水平。
世界各大IT巨頭在同傳領域競爭激烈,但是NICT仍有勝算。隅天英一郎指出,美國的微軟、谷歌以及中國的百度實力相當,目前都只停留在整句分割的階段,尚未在意羣分割法上取得成果。若能利用AI同傳將日語順利譯為其他世界主要語言,日本將在國際上佔據優勢。
英語、漢語、法語這些使用者眾多的語言有一個共同特點:名詞後面緊接動詞。世界上約有40%的語言都屬於此類型。實際上,還有大約一半的語言與日語語法結構相似,動詞放在整句後部。同類型語言之間更加便於同傳。如果能夠研發出跨語言類型的高性能同傳技術,那全球90%的語言都可以實現互譯。