新浪科技訊 北京時間 6 月 24 日晚間消息,據國外媒體報道,當前的人工智能(AI)技術仍存在諸多偏見,從某種角度講,這也是相當危險的。
這是一張令人震驚的圖片,凸顯了人工智能(AI)研究根深蒂固的偏見。將美國第一位黑人總統巴拉克 · 奧巴馬(Barack Obama)的一張低分辨率照片,輸入到一個 " 消除馬賽克 "(生成清晰圖像)算法中,輸出的結果竟是一個白人男子。
這不僅僅是奧巴馬一個人的問題。使用同一算法,輸入女演員 Lucy Liu 或國會女議員亞歷山大 · 奧卡西奧 · 科爾特斯(Alexandria Ocasio-Cortez)的低分辨率照片,得到的高分辨率圖像,面部同樣是白色的。
正如一條很受歡迎的推文(消息)引用奧巴馬的例子所説:" 這張照片充分説明了人工智能偏見的危險。" 但是,是什麼導致了這些輸出呢,它們到底告訴了我們關於人工智能偏見的什麼信息呢?
首先,我們需要稍微瞭解一下這個圖像生成技術。生成上述清晰圖像的程序是一種名為 "PULSE" 的算法,它使用一種被稱為 " 放大 "(upscaling)的技術來處理視覺數據。
就像人們在電視和電影中看到的 " 放大和增強 ",但與好萊塢不同的是,真正的軟件不能無中生有地產生新數據。為了將低分辨率圖像轉換為高分辨率圖像,軟件必須使用機器學習來填補空白。
具體到 PULSE,完成這項工作的算法是 StyleGAN,由英偉達研究人員開發。
PULSE 所做的是,使用 StyleGan 來 " 想象 " 低分辨率圖片的高分辨率版本。這不是通過 " 增強 " 原始的低分辨率圖像來實現的,而是通過生成一個全新的高分辨率人臉來實現的。
而 PULSE 的創建者表示,趨勢很明顯:當使用該算法放大低分辨率像素化圖像時,該算法通常會更多地生成具有高加索特徵的人臉(即白種人人臉)。該算法的創建者在 Github 上寫道:" 與生成有色人種的臉相比,PULSE 似乎更容易生成白種人的臉。此偏差可能繼承自訓練 StyleGAN 的數據集。"
換言之,由於訓練 StyleGan 所使用的數據,當它試圖設計出一個低分辨率圖像的高分辨率版本時,它默認使用白種人特徵。
事實上,這個問題在機器學習中非常常見,這也是面部識別算法在非白人和女性面孔上表現較差的原因之一。用於訓練人工智能的數據通常偏向單一的人口統計學,即白人男性,當一個程序看到數據不在這個人口統計學中時,它的表現就很差。還有一個不算巧合的巧合,主導人工智能研究的恰是白人男性。
但是,奧巴馬的例子到底揭示了關於偏見的什麼,以及它所代表的問題可能如何得到解決,這些都是複雜的問題。事實上,它們是如此複雜,以至於這張圖像在人工智能學者、工程師和研究人員之間引發了激烈的分歧。
在技術層面上,一些專家甚至不確定,這究竟是不是數據集偏見的一個例子。但不管是什麼原因,算法的輸出似乎是有偏見的。而且,在該工具廣泛使用之前,研究人員沒有注意到這一點。
人工智能問責研究人員黛博拉 · 拉吉(Deborah Raji)稱,這種偏見在人工智能世界裏太典型了。拉吉説:" 考慮到有色人種的基本存在,不對這種情況進行測試是令人震驚的。有色人種不是異類,不能輕易忽視他們。" ( 李明 )