編者按:本文來自智能相對論,作者離離,創業邦經授權轉載。
“由於漢化組成員身體抱恙,本週暫時停止更新。”看到這樣的消息,小武嘆了口氣,默默退出應用程序。這已經是他喜歡的動漫在兩個月內的第三次停更了。
環視四周,上下班時間的公交和地鐵上,隨處可見戴着耳機盯着手機屏幕、利用碎片時間追番看劇的年輕人。在步調緊湊的現代生活中,觀看影視劇和動漫已經成為不少上班族的日常娛樂消遣。
信息傳播的日漸便利,讓人們有機會在網絡上觀賞更多來自不同國家地區、各式各樣題材的影視動漫作品。但在那之前,字幕、對話的翻譯與排版,以及改漫作品的圖像繪製可是一項耗費人力物力及時間的大工程。一些較少人關注的小眾作品經常因為翻譯問題而無法及時更新。
“像我喜歡的一些動漫及小説、影集改漫作品,可能受眾太少吧,大型平台沒有引進,只能通過特定的粉絲論壇和網站收看。但這些網站的漢化時間與翻譯質量十分不穩定,有時也挺糟心的。”即便作品內容可以及時更新,但缺少了漢化翻譯,像小武這類沒有日文基礎的讀者根本無法理解劇情發展。
隨着科技進步,人工智能已經能在文本、圖像的識別與翻譯方面發揮不少作用,應用及商業化也早已成熟,Google、微軟等不少互聯網及科技公司都曾推出相關的服務。
“智能相對論”看到, 國內的互聯網公司也推出了不少AI翻譯產品,並已取得不錯的商業成果。如百度大腦AI開放平台就推出了在線通用文本翻譯業務,可實現兩百個以上的語種在線互譯,做到實時文本翻譯及譯文語音合成,能應用於移動端、PC網站及各類智能硬件。
其文檔翻譯及圖片翻譯功能則可識別不同檔案及圖片格式,在不改變文檔格式的前提下完成翻譯工作。去年三月,百度翻譯的每日翻譯量已達到千億次;也為滬江網校、OPPO、海淘1號等不同領域的企業提供通用文本翻譯服務。
網易的有道智雲平台也提供實時語音翻譯、文本翻譯、圖片翻譯及部份語言離線翻譯等服務,支持超過110個語種的自動識別與互譯,能為直播、錄播視頻提供實時字幕轉寫翻譯。騰訊雲也推出了機器翻譯產品,可實現文本翻譯、語音翻譯、圖像翻譯等多種功能,支持API方式接入。
科大訊飛則基於語音識別技術推出了一個視頻譯製智能協作平台,這款A.I.視頻字幕製作應用具備自動創建視頻字幕、字幕機器翻譯、在線校對、譯後編輯和團隊協作等功能,可利用人工智能機器翻譯,自動為外國視頻添加中文字幕,目前累計用户為105萬。
即便現有的AI翻譯產品種類多樣,但漫畫的表現形式與一般文本不同,其翻譯嵌字問題並非一般的翻譯軟件就能解決。
來自不同角色的對話、擬聲詞、文字註解、旁白等主體和作用不同的文字都會出現在同一幅圖片中,一頁漫畫中的文字通常包含多種字體、大小,且漫畫中的對話框文本排版並無規律。面對此類特殊的表現形式,普通的翻譯軟件往往無法完整地讀取、識別所有需要翻譯的文字。
“之前我曾經試過將原文漫畫圖片上傳翻譯軟件,但效果不佳。翻譯出來的文字經常超出對話框,一些手繪、異形及不同大小的文字經常沒法識別,整體而言作用不大,試過一次就沒再用了。”小武告訴“智能相對論”。
為了幫助像小武這類的讀者即時看到翻譯完成的作品,並解決民翻盜版問題。去年,一家專門從事漫畫的機器翻譯技術公司完成了一款從識別、翻譯到嵌字都能自動完成的AI自動翻譯系統“Mantra Engine”。
AI漢化組coming漫畫的翻譯工作主要可分為文本轉錄識別、對話框內及背景文字翻譯、翻譯後的文本排版三個步驟。
在文本識別方面,Mantra的研究團隊開發了專門用於漫畫字符識別的OCR引擎,可定位識別來自不同角色的對話、擬聲詞、文字註解、旁白等主體和作用不同的異形文字,即便漫畫圖片十分擁擠也能夠辨識。
在內容翻譯上,這款應用程序針對漫畫常出現的,因角色轉換或畫面連貫造成的主賓語銜接或缺位口語對話模式,以及傳統商務翻譯中少見的口吃與結巴等特殊句式加強訓練。
通過文本分組、文本閲讀順序、提取視覺語義三種方式,結合對話語意和角色情緒、動作,實現多模態的上下文感知,幫助翻譯出最符合角色人設、表情與情感的多語言譯文。
作為一套AI自動化翻譯引擎,Mantra可自動擦除原文字符,並於圖像上嵌入符合譯文語言形態的文字排版,包含對話框的增減、拆分與文字對齊等功能。為漫畫翻譯中耗時最久、人力成本最高的嵌字工作提供更加快速有效的自動化解決方案。
實驗結果顯示,這款程序比傳統人工翻譯所需時間減少了一半;整體而言可減少六成至七成的翻譯成本。目前,這套系統可輸出JPG、PNG和PDF等格式,但能翻譯的語言並不太多,翻譯結果也仍需人工修正。
研究團隊表示,下一步將提高翻譯準確度,開發針對漫畫表情的識別系統,並計劃拓展可用語言。希望能將該技術以計量收費的形式,幫助漫畫出版行業拓展海外市場,並協助漫畫作者在社交媒體上自由地發佈作品。
有待發現的需求事實上,Mantra自動翻譯系統的誕生並非由於研發團隊創造了全新的先進技術,而是研發者看到細分市場的需求,將已經發展成熟的AI翻譯技術與圖像識別轉換加以融合應用,試圖優化現有的生產方式,希望在降低成本的同時提高產出效率。
雖然國內的OCR識別與AI文本翻譯技術早已成熟,除了漫畫漢化所需的自動嵌字技術尚待開發,不少互聯網公司已有能力提供多種類型的AI翻譯服務。但在商業應用方面,仍集中於商務交流、出國旅遊、教育學習方面。
目前市面上應用於影視文化、知識產權等文化產業的AI翻譯產品大多為基於語音識別技術的視頻字幕語言轉換服務,針對漫畫及圖書繪本的翻譯需求所設計的自動化解決方案尚未出現,漫畫翻譯的市場需求似乎仍未受到關注。
“智能相對論”以百度為例,其文字識別服務雖包含卡證、票據等多場景的OCR識別,使用方式有云端、離現實別SDK、私有化部署等;文字翻譯方面,也提供AI翻譯定製化服務,可由用户自行上傳特定領域的語料庫,為AI翻譯模型進行訓練。但在應用場景上仍需要客户“自行想象”,尚未發展出像Mantra那樣專門針對漫畫、指向明確的自動化“一條龍”翻譯服務。
近年,國內語言服務行業涉及的翻譯服務領域呈現多樣化。《2019中國語言服務行業發展報告》顯示,在受訪企業中,影視文化與知識產權的訂單佔比各佔36.7%和36%。國內二次元羣體不斷擴大,在線動漫市場規模持續增長,用户為內容付費進出口逆差也不斷增加,漫畫翻譯的市場需求也逐漸明顯。
Mantra的出現為人工智能在動漫製作與傳播方面開啓了新的應用模式與細分市場。從生產商與出版社的角度而言,可節省創作時間與勞動成本,在促進作品的海外傳播效率並防止盜版;站在小武等讀者的立場,能更快看到新鮮出爐的作品,不再為語言翻譯問題所苦。
在二次元文化“出圈”、動漫受眾不斷增加的今日,AI所帶來的生產力與傳播效率提升,或可帶來不少商業機會。以動漫大國日本為例,據日本出版科學研究所統計,2020年,日本漫畫市場規模較上一年增加23%,達6126億日元,創1978年開始統計以來的最高紀錄。
據艾瑞諮詢統計,中國泛二次元用户規模自2014年來持續上升,至2019年已達3.9億人,在線動畫及漫畫市場規模進入穩步增長。《2020微博動漫白皮書》顯示,微博泛二次元用户同比增長11.4%,連續4年保持穩定增長;54%的動漫用户是內容付費用户。在泛娛樂融合的產業背景下,動漫行業前景可觀。
一如Clubhouse的爆火,即便多人在線語音通訊技術早已成熟、語音社交早已出現,仍有部份需求未被覆蓋。就像Mantra告訴我們的,一些AI技術發展成熟後想要走的更遠,還需要更有想象力的應用場景。對於掌握成熟AI翻譯技術的百度、網易、科大訊飛等企業而言,AI自動翻譯漫畫這個暫時未被注意的應用場景或許能帶來新的機會。
本文為專欄作者授權創業邦發表,版權歸原作者所有。文章系作者個人觀點,不代表創業邦立場,轉載請聯繫原作者。如有任何疑問,請聯繫