近日,繼“小妮”之後,京東數科第二位國風AI主播“小可”來了,嬌俏可愛的樣子根本看不出來是AI技術虛擬出來的人物。
據瞭解,為了研發出寫實逼真的AI虛擬數字人,京東數科AI實驗室在文字轉語音、3D人臉建模、語音轉視頻等方面進行了一系列技術創新。僅需使用一段幾分鐘的人物視頻數據,經過幾小時訓練就可以合成出寫實風格的AI虛擬數字人。
京東數科自研輕量級對抗語音合成技術,通過結合深度神經網絡在多人數據上進行個性化建模,達到音色豐富、特色鮮明的語音合成效果,甚至可以模擬人的呼吸和停頓,聽感酷似真人。
小可能夠模仿不同人的説話習慣,學到如何用點頭、眨眼這些細微動作對發言中的重要內容加以強調。在AI算法的驅動下,只需輸入文本內容,小可就能根據語義實時進行主持,且表情、動作和語音表達非常自然逼真。