中新網5月25日電 最近,各信息平台出現的新華社新聞播報引來大家關注,原因就是一些新聞不是真人播報,而是運用AI和3D技術打造的虛擬數字人主播播報。直觀來看,單從聲音很難分辨出是真人還是虛擬人物,如果不是標題標註“AI主播”字樣,大家很難分辨出這是AI的虛擬人物主播在播報新聞。這就是搜狗聯合新華社推出的3D AI合成主播“新小微”。
搜狗3D AI合成主播採用領先的掃描還原算法,以及面部肌肉驅動、表情肢體捕捉等超寫實3D數字技術,生成高度還原真人髮膚的形象逼真的數字人物模型,,在搜狗分身AI算法的驅動下,只需輸入文本內容,這個數字人模型就能根據語義實時播報新聞。重要的是,AI虛擬人物主播的表情唇動、肢體動作和語音表達高度契合,自然逼真度接近真人。
據瞭解,搜狗的AI主要沿着兩條線發展,一個是自然交互,一個是知識計算。核心是語言AI。通過人和機器之間進行非常自然的交互設計,從而達到自然逼真的效果,這其中也使用視覺和聽覺的能力。;在知識計算上有三部分能力:對話、問答、翻譯。而目前的AI合成主播涉及到搜狗整個AI技術鏈條上的核心技術。
搜狗AI交互技術部總理陳偉近日接受媒體採訪介紹到, 聯合新華社打造的3D AI合成主播項目研發週期有半年左右,其中包括數字人物建模、動作採集。 畢竟現在數字人本身的技術不是很成熟,搜狗AI希望能更快速地構建一個好的3D建模能力和數據能力,更重要的是打通3D技術和AI技術。
事實上虛擬人賽道上不少頭部企業都有涉獵,對於較早入局的搜狗也有自己的看法,陳偉認為,真正的AI有外在的AI也有內在的AI。外在的AI就像“搜狗分身”具備逼真或者高逼真的形象。
他還指出,現在的語音助手、電視、音像等用户的一個助手,按照擬人化的方式來溝通,大部分公司還停留在做一個語言助手或者做一個有對話能力的機器人。但陳偉認為人機交互應該是內外兼修的,外在的擬人化和內在的擬人化都應該具備,從現在來説,搜狗是走在了行業前端。
對於未來,陳偉表示,接下來搜狗AI主路線是讓一個具備表達能力的虛擬人物具備交互能力,這是搜狗分身發展的主路線。未來搜狗將會在整個3D AI合成人物技術下不斷地打磨,結合更多的場景做出更自然的表現。例如,不久的將來,AI主播可以到外景去做交互式採訪。
據悉,搜狗AI主播的商業化最早落地的是媒體領域和廣電領域,陳偉認為媒體領域主播這種類型有一個成熟的流程,即採、編、播、管和存的先後順序,使得它可以從新聞素材的採集到製作到播放,使用AI合成來順利完成一個流程化的工作,解放繁瑣重複的人工工作。目前搜狗和一些電視台或媒體的渠道商在合作,把AI主播集成到客户的系統。
其次,在金融行業,搜狗已經做出第一個在金融領域落地的AI面審客服:去年在平安普惠APP上線了第一個AI面審客服,把具有交互式AI客服嵌入到平安普惠服務中,現在用户使用平安普惠APP的貸款,可能就是搜狗AI客服在對接。陳偉表示,這項服務已經在平安普惠的客服裏面大規模使用了。基於這樣的能力,未來也會帶動搜狗在金融領域裏快速普及。
陳偉坦言,未來3D AI虛擬人物在更多領域具備發展空間,因為它的靈活性和可控性,使得搜狗可以在更多場景下做很多事情,例如,醫療健康、教育、金融和泛娛樂行業,面向大眾的行業都可以使用。
曾經有人擔心,AI會減少社會工作崗位,但陳偉不這麼認為,他指出,AI是要解決密集型勞動和重複性勞動的職業痛點。AI真正給社會帶來價值是降本增效,把人力成本降下來,讓工作效率提升,例如目前客服、媒體等行業。
陳偉還認為,AI虛擬人物技術正在逐漸取代部分人工工作,目的是到最後真正完全替代人工。把人從重複性工作解放出來,做更有創新性的工作,這是AI技術未來發展所思考的。
陳偉表示:“目前AI主播以室內播報為主,外景方面也會很快上線,兩會期間搜狗優先保證給新華社搭建一套線上完整的虛擬演播廳,在虛擬演播廳下會支持他的站姿、坐姿播報,同時引入了動作、表情、有表現力的一些場景,使得從前到後的製作流程高效化,新聞稿件輸入進去立刻生成一個製作精良的3D AI合成主播播送的新聞。”(完)