IT之家 3 月 19 日消息 近期,微軟針對面對面對話和會議推出了免費實時語音到文字轉錄和翻譯應用程序——Group Transcribe。一方面,Group Transcribe 可以通過手機把會議的語音內容實時轉錄為文本,供與會者閲讀和瀏覽。另一方面,在實時交流過程中,如果與會者使用不同語言,其翻譯功能也能讓每位參會者流暢地進行跨語言溝通,即使有聽力障礙的人士參會也全無障礙。高準確度堪比專業速記和同聲傳譯水平。這大大提升了會議的協作效率和參會者的與會體驗。
IT之家獲悉,Group Transcribe 在會議開始後,用户可以通過二維碼、藍牙等方式邀請加入會議。採用了微軟最先進人工智能語音技術,可以根據會議中每部手機麥克風對發言者進行收音,並進行語音識別及會話轉錄,讓每位參會者都可以在其手機上看到即時轉錄的會議文本或翻譯,並可在會後獲得會話記錄。
微軟全球技術院士兼微軟 Azure AI 首席技術官黃學東表示:" 微軟在人工智能語音和自然語言的創新方面處於領先地位,我們通過 Project Denmark 率先對分佈式和動態麥克風陣列進行了研究。在此基礎上,Group Transcribe 可以滿足真實、實時、交互式的移動場景,從而讓人們可以無語言障礙的溝通交流。”
▲Pavan(左)和 Vishal(右)正在交談,Vishal 使用英文,Pavan 使用中文,雙方設備實時轉錄中
目前市場上的同類產品大多使用單設備轉錄,即每位參會者需要對着同一部設備的麥克風講話。參會者不僅很難從會議記錄或翻譯文檔中準確區分發言人,而且所有參會者共同使用同一部設備説話,這在疫情之下或多或少地會引起人們對社交距離的擔憂。
Group Transcribe 運用多設備轉錄,參會者可以分別對着自己的手機説話,也可以在手機上看到所有參會者語言的即時轉錄文本或翻譯。
Group Transcribe 打破了交流的障礙,讓每位參會者都能自如地用自己擅長的語言實時參與對話。對於聽力障礙、外部環境嘈雜或非母語的與會者來説,他們很難跟進演講的內容,Group Transcribe 轉錄功能可以幫助他們進行流暢自然的交流。當然,Group Transcribe 的使用場景不只限於會議,上課或者小組討論記筆記,看音頻或視頻需要實時字幕也都可以使用。
目前,Group Transcribe 已在 iOS 中國區 App 商店上線。其他版本也即將發佈。