圖片來源@視覺中國
文 | 智慧相對論,作者 | 黃康瑄
“醒來燦爛星光透過了窗臺,海岸線連線了那片山川大海。湧動夢境邊緣像是空曠舞臺,在眼前忽然展開。”看到這段文字,你的腦海中是否浮現出靛藍星空風雲變幻、透出曙光豁然開朗的景象呢?
網易“醒來”這段文從字順且頗具畫面感的歌詞並非出自人類之手,而是由網易新開發的人工智慧所創作。日前,由網易伏羲、網易雷火音訊部提供作詞、作曲、編曲、演唱等全鏈路AI技術支援的歌曲《醒來》,在“2020網易未來大會”上正式釋出。這是網易首次完成由AI完全生成的歌曲,從創作到演唱,整首歌曲從無到有僅需一小時。
其實在此之前,網易一直都在默默進行大資料平臺、強化學習、影象動作、自然語言處理等圍繞遊戲領域的人工智慧研究,畢竟遊戲才是人家最賺錢的業務。《醒來》的歌詞創作就是依託於網易遊戲伏羲人工智慧實驗室較為成熟的語言處理技術。
網易伏羲利用其自主研發的“有靈智慧創作平臺”,讓AI學會人類語言組織的基本邏輯。再借助大規模語料訓練實現端到端的歌詞生成,並透過自研的方法控制不同引數下的歌詞創作。
有靈平臺的預訓練語言模型可提高歌詞質量,確保生成內容的流暢性和上下文相關性。如《醒來》的歌詞內容便是為了契合大會主題“洞覺·未見”而編寫的一個關於AI虛擬人類在深夜甦醒的故事。
“智慧相對論”瞭解到, 作曲方面,網易伏羲根據樂理的資料分析,形成一套用於生成旋律的演算法,可以在短時間內排列組合出多個實用性生成結果。
編曲則採用雷火音訊部自研的智慧編曲引擎,從華語樂壇大量主流歌曲中識別大眾審美偏好,在15-30秒內生成一首出版級編曲。而相同質量的人工編曲,市場價格在1-1.5萬元左右。網易的此項技術已具備工業化大批次生產的能力。真沒想到,一個做遊戲起家的公司竟能研發出如此成熟的AI音樂技術,AIVA和微軟小冰或許將迎來新對手。
除了作詞與編曲,以雷火音訊部提供的大量遊戲配音應用案例及龐大的歌聲資源為基礎,網易伏羲藉助神經網路聲學模型和聲碼器自動根據曲譜,實時生成契合歌曲主題且“幾可亂真”的歌聲,並確保“主唱”在不同BPM、風格歌譜上音高、節奏的穩定性。
“還可以嘛,不說還聽不出是AI唱的。”“挺像真人的啊!”甚至還有網友從中聽出了張韶涵、鄧紫棋等歌星的“味道”,可見網易AI的歌聲幾乎能以假亂真。不鳴則已,一鳴驚人。
百度“睜眼”雖然中國的AI作曲發展速度不如國外,但近年也算是“多點開花”,逐步落地。在網易之前,騰訊、百度、蝦米等網際網路公司及音樂平臺都曾在不同程度上對人工智慧作曲進行探索。
2016年,百度曾透過人工智慧識圖作曲技術,將勞森伯格“四分之一英里”畫作中的兩個部分分別譜成鋼琴曲。還讓AI根據梵高的《星空》、徐悲鴻的《八駿圖》創作樂曲,前者音韻柔和耐人尋味,後者節奏明快緊張刺激,在一定程度上與畫作意境相符合。但作為第一個成功研發此項技術的中國科技公司,百度似乎“志不在此”,並未繼續探索相關技術。
為了趕上百度,騰訊AI Lab也憑藉自主研發的強化學習演算法,開發了AI識圖作曲技術,並製作出“把照片唱給你聽”的體驗Demo。使用者上傳1到4張圖片後,AI會生成相關的文字描述並匹配韻腳歌詞,再透過合成語音配合旋律RAP出來。此外,蝦米音樂也在其APP推出了簡易的人工智慧作曲功能“探樂行動”,透過讓使用者自行設定曲風、心情、節拍等引數,自動生成樂曲旋律。
騰訊“開口”不同於百度和蝦米的淺嘗輒止,騰訊選擇在人工智慧作曲的道路上繼續前進。今年六月,騰訊AI Lab推出AI數字人(Digital Human)“艾靈”,可透過使用者提供的關鍵詞自動生成歌詞並演唱。
AI艾靈的歌聲是透過分析曲譜與人類說話語音,使用真人聲音訓練得到的深度神經網路聲學模型和聲碼器模型,可模模擬人聲線合成音訊。
與“初音未來”等虛擬歌姬的“機器合成,人工調教”模式不同,AI艾靈使用的DurIAN聲學模型具有自動除錯的優點,讓它不需經過人工就能生成較“自然”的聲音,還能合成跨語種歌聲。但從聽感上來說,AI艾靈目前的歌聲和真實人聲還是有點差別。
AI艾靈的歌詞生成則是基於騰訊AI Lab最新研發的歌詞創作深度學習模型SongNet。該模型最大的特點就是可給定任意格式和模板來生成相契合的文字。能對上下文語義和格式同時建模,兼有全域性生成和區域性精修兩種功能。依靠關鍵詞創作歌詞的技能就是來源於此。
雖然如此,SongNet模型仍存在侷限。約束上下文和蘊含特定關鍵詞的限制會在一定程度上降低模型生成歌詞的邏輯性和連貫性。目前AI艾靈只能生成基礎歌詞和合成歌曲,尚未無法實現完全自由的創作。
嘗試變現除了網易與騰訊等網際網路公司的自主研發,位元組跳動則直接“撿現成”,透過收購Jukedeck的方式入局AI作曲。近年,國內一些音樂公司也在此領域孵化出成果,並進行了商業化的嘗試。
如上海若鳶智慧科技公司開設Deepmusic人工智慧音樂—全球免版稅音樂生成平臺,為影片、遊戲、音樂等內容創作者提供快速製作背景音樂的服務。北京靈動音科技有限公司(DeepMusic)推出AI作詞和作曲服務,幫助沒有任何音樂專業知識的普通人也可以輕鬆地創作出屬於自己的個性化音樂。
版權內容機構HIFIVE(成都嗨翻屋科技有限公司)運用AI、大資料和雲計算技術,為音樂內容生產者及使用者提供版權交易和增值服務,其智慧音樂助手小嗨具有聽歌識曲、作曲、作詞三項功能,其網頁版可免費使用。
去年上線的“哼趣”APP則利用AI語音識別技術,根據使用者哼唱的內容、音調、旋律自動生成一段完整的、可編輯的曲子。現可免費下載使用。
國內的AI作曲技術落地已有一段時間,但市場滲透率似乎不高。或許是由於上市時間還不夠長,尚未獲得市場關注;也可能是因為C端市場並沒有想象中廣闊。
對於本身就具備專業創作能力的音樂人而言,詞曲創作是個人情感表達與交流的一種方式,將其過程完全假手AI便失去了意義。能自動生成詞曲的AI技術僅能用來啟發靈感,並非絕對必要;他們更需要的應是現有編曲、錄音軟體和裝置在使用上的智慧化,幫助他們提高音樂製作效率。
對創作慾望強烈的音樂小白來說,AI作曲技術的確能幫忙實現創作目的,也可作為不錯的娛樂。但若作為收費服務,或許會勸退一大批使用者。畢竟業餘愛好者的需求有限,而具有為此消費的強烈興趣之人,大多對音樂審美與創作有一定要求,且多半早已付錢學習專業的音樂創作技巧。因此,AI作曲技術的主要市場,應是對音樂生產有大量需求,又沒有太高審美要求的B端。
“智慧相對論”瞭解到,在上述音樂公司中,HIFIVE的商業化較為成功。To C方面,小嗨可自動生成音樂模板,輔助音樂人以此為基礎進行再加工,縮短作品的創作週期。作為一家商用音樂授權機構,HIFIVE的核心業務在於對音樂內容進行確權、授權,併為品牌、活動、遊戲、影視等提供定製音樂服務,並販售版權。服務物件仍以B端為主。目前,HIFIVE平臺上已有超過1000首小嗨創作的成品音樂可以用於授權,在廣告配樂或大型活動等特定場合,使用小嗨創作的背景音樂或許具有較高的價效比。
更多可能不同於音樂公司專注於“老本行”的商業應用,網易與騰訊瞄準B端市場,嘗試擴大AI作曲技術的應用範圍。國內能自動生成音樂詞曲內容的應用雖然不少,但自動合成模擬人聲的技術屈指可數。在這方面,網易AI與騰訊AI艾靈的“出道”標誌著國內人工智慧作曲技術的重大進步,也比其它國內企業更具優勢。
作為數字虛擬人的AI艾靈除了用於降低歌曲製作錄音環節的成本,還能在其聲音合成技術更加最佳化、更加“逼真”之後,循著小冰框架的路線,用於打造虛擬偶像。目前,AI艾靈在這方面還處於探索階段,尚未出現突破性進展。但目前國人對虛擬偶像的喜愛及接受程度遠不如深受二次元文化影響的日本,虛擬偶像是否能讓AI艾靈成功“破圈”,似乎還需要透過時間和市場來驗證。
此外,AI艾靈“規則明確”的語音合成技術很適合用於生成遊戲解說詞等具有固定內容的加工創作。現在,除了Bilibili主播,艾靈還多了“王者榮耀遊戲解說”的工作。基於智慧數字人的互動技術,音樂教育方面的應用也是AI艾靈未來的探索方向之一。但目前AI教育產業也仍處於探索階段,AI艾靈在這方面的嘗試可說是摸著石頭過河。
而“唱作俱佳”的網易AI技術應用範圍更加廣泛。除了用於遊戲,減少背景音樂、相關歌曲的開發時間與成本之外,其達到工業化大量生產水平的AI詞曲創作及歌聲合成技術也可作為一個單獨的產品。作為網易最新的技術落地成果,網易目前尚未明確其AI歌曲創作及演唱技術的商業化路徑,目前僅將其中的文字生成技術進行商業化探索。
如作為“AI作詞”技術支援的“有靈智慧創作平臺”開始以“人機協同”的創作輔助模式幫助使用者創作詩詞、歌詞與劇本。透過使用者輸入的關鍵字詞甚至是心情、故事,AI演算法就會根據使用者的需求,自動推薦相關的場景、意象、畫面,提高文字生成的質量;也可直接生成詩詞、歌詞等作品。使用者也可以在創作過程中隨時開啟AI續寫,還可以提供多種候選段落支援使用者選擇和修改。
AI作詞技術若面向C端,仍會出現和作曲一樣的“藝術追求”問題,或許較不利於變現。將這樣的AI文字創作技術用來為B端批次生產廣告劇本、宣傳歌曲或模式化的品宣文字等似乎更具商業價值。
目前看來,AI作曲產業還是一片藍海,商業競爭仍以B端市場為主。誰家的AI能以更低的價格,創作出更契合大眾審美的音樂、發出更符合使用者喜好的歌聲,誰就能取得領先。這種建築在對人類審美深入理解上的AI技術最佳化,在降低生產成本的同時,似乎也讓人有些不寒而慄。
隨著人工智慧一步步“入侵”藝術創作領域,網易AI的醒來讓本就渾濁的世界更加難辨真假。在創造者與被創造者皆“期待卻不知未來如何安排”的當下,希望未來真的能像網易AI所唱的那樣,終將為我們彼此而喝彩。
參考資料:
1. 網易伏羲實驗室《網易未來大會首發AI原創單曲 唱功媲美專業歌手》
2. 中國電子報《騰訊緊隨百度完成“AI識圖作曲” 中國人工智慧全面崛起》
3. 騰訊AI Lab《唱作俱佳 騰訊AI艾靈領唱中國新兒歌》