楠木軒

AI新技能:藝術品歸類與品鑑

由 敖學農 發佈於 休閒

藝術品的歸類與分析向來以困難著稱,只有極少數專業人士擁有發言權,人工智能在這一領域的應用更是長期空白。但最近,已經有多個研究小組做出嘗試,希望將機器學習與大型藝術品數據庫相結合,以有意義的方式對作品做出分類與描述。

首先,來自杭州的浙江工業大學研究人員對多種神經網絡做出比較,希望瞭解它們在藝術品歸類方面表現如何。他們使用來自WikiArt及其他數字館藏的圖像進行神經網絡訓練,幫助模型瞭解特定藝術流派所對應的畫作擁有哪些共性。以此為基礎,他們進一步嘗試使用不同神經網絡模型識別其他畫作的藝術風格。

很明顯,這項工作即使對人類來説都頗為困難。一部分畫作在繪製方法上有着非常強烈的風格與流派特徵,相對更容易識別。對於神經網絡來説,找出歸屬於立體主義流派的作品並不是問題;真正的問題在於,某些流派之間非常相似,甚至在繪畫過程中的呈現點位也高度一致,導致程序很難做出準確判斷。

在德國柏林一場展覽中亮相的文森特·梵高的《星空》。人工智能也在研究中使用這幅作品嚐試進行藝術流派歸類

此外,藝術歸類神經網絡還面臨着很多完全影響不到人類的微小細節,例如,區分城市景觀與自然景觀間的差異。人類無需任何思考,就能指明建築物與自然風光間的區別;但在計算機看來,二者似乎都代表着典型的“户外”元素,而界定户外的關鍵特徵“雲”與“天”並不能幫助模型真正看懂畫面內容。

對於人類藝術愛好者,瞭解一件藝術品屬於哪種流派或者類別,屬於一種相對直接而且客觀的判斷。與神經網絡類似,我們可以觀看大量藝術品並從中尋找同流派作品的共通模式。但相較於人類,計算機卻很難更進一步:形成對於藝術的自主觀點,並用言語分享觀看時產生的感受。但到底只是更難,還是根本不可能?

人工智能的根基源自訓練數據。因此,要教會AI形成關於藝術風格的觀點與情感陳述,我們還需要投入大量人工,建立起關於不同藝術品的描述內容。斯坦福大學、巴黎綜合理工學院以及阿卡杜拉國王科技大學的研究人員們決定做出嘗試,他們創建起ArtEmis數據集,其中包含超過40萬項情感屬性以及整理自WikiArt的超過8萬張畫作的描述信息。

為了創建ArtEmis數據集,研究團隊要求志願者們分享自己對於藝術品的直觀感受,並用語言做出評述。可以想見,人們對於相同作品往往有着截然不同的感受。您眼中安詳寧靜的田野畫面,在我眼中可能壓抑而陰鬱。實際上,這種對同一幅畫作做出正面與負面感受的情況非常普遍,在ArtEmis數據庫的全部畫作中佔比高達61%。

接下來就看AI的表現了。在接受ArtEmis數據集的訓練之後,各AI系統開始嘗試為給定的藝術品生成標題。其中一些結果頗具説服力,當然也有不少完全是驢唇不對馬嘴。例如,AI對倫勃朗的畫作《被斬首的施洗約翰》做出的描述包括“女性看起來很開心”及“中間位的男性看起來很痛苦”。結合畫面中的場景,這很明顯是在胡説八道。

▲ 某AI算法會根據從畫面中識別出的人類情感生成圖像描述。此算法在描述倫勃朗的《被斬首的施洗約翰》時提到“女性看起來很開心”、“中間位的男性看起來很痛苦”

但好消息是,計算機生成的描述中約有半數通過了圖靈測試,意味着AI確實可以學會生成令人信服的原創藝術品描述。但目前的情況還遠不夠完美,畢竟神經網絡連準確判斷畫中是自然風光還是城市景觀都有困難。

必須承認,不少藝術品本身天然難以歸類,人們對繪畫的觀點也具有很強的主觀性,這就導致人工智能更難理解我們的歸類與描述方式。但此次最新研究表明,計算機在某些任務的處理方面一直在進步。也許與人類的藝術品歸類與描述能力仍然無可匹敵,但AI程序已經邁出了追趕的腳步!