9月,網易有道詞典官宣了代言人王源,也上線了王源同款“明星語音”功能,10月假期剛過,這支明星語音背後的團隊又低調地拿下了一個國際語音大獎,即Interspeech2020口音英語語音識別挑戰賽。
Interspeech是由國際語音通信協會ISCA組織的語音研究領域的頂級會議之一,今年的賽事吸引了來自全球各地的語音技術研究者,競賽指導委員會來自上海交大、南洋理工和美國約翰霍普金斯大學等高校和機構。有道人工智能產品部的語音團隊在這屆競賽中獲得二等獎。
目前,有道在AI領域的佈局主要分為,自然語言處理(NLP)、圖像識別(OCR)和語音識別與合成,其中自然語言處理和圖像識別都是有道的強勢技術領域,為有道在互聯網產品端做了大量的技術賦能。
語音團隊是成立時間相對最短,且團隊非常年輕,主要負責這次競賽項目兩位團隊成員都是90後,其中一位是95後。
近年,有道在AI領域斬獲頗多,除了不斷更新迭代的有道詞典筆等硬件產品,有道精品課等在線教育業務上,也應用了語音識別、口語打分、AI作文批改等智能技術。
帶着技術基因發展的網易有道,在語音、翻譯等領域已有技術底藴,技術也推動了有道的內容佈局。
以翻譯技術起家的有道,在AI時代攻堅神經網絡翻譯技術(NMT),目前其NMT準確度已達到國際領先水平;AI作文批改曾入選機器之心2020人工智能金煉獎;作為王牌技術之一的OCR識別技術,已經能支持26種主流語言文字,是目前國內識別語言最多的OCR識別引擎。
當有道詞典筆逐漸成為學習場景的“三大件”之一,語音識別技術更加精進。9月推出的王源“明星語音”功能背後,則是有道自主研發的定製語音合成(Text To Speech,簡稱TTS)技術實力。
(有道語音團隊合影)
孫豔慶談及開發“明星語音”功能時,非常感概團隊的不懈合作。面對這一羣90後、95後同學,他們有的是貓奴,有的沉迷俄國文學,有的嚮往技術追星,孫豔慶的團隊要求只有,活潑且腳踏實地。
“儘管我們會參加比賽去測試我們的技術成熟度,但整個有道AI團隊更注重給用户更極致的體驗,希望把技術儘快觸達到用户手裏,獲得好的用户體驗和反饋。”