自從有了AI,我已經開始分不清真假了

你能想象到你在論壇看到的高贊跟帖或者回答,其實並不是真人寫的嗎?

這可不是一本正經的胡説八道,而是切實發生在我們身邊的事情。在國內,已經有人自己訓練出來的NLP模型在知乎隨機回答問題,並且做到了被點讚的答案的top3。

是不是很恐怖?其實知乎並不是AI被用於回帖的第一陣地。最早有人用AI回帖,其實發生在美國的reddit論壇,事件源於OpenAI開發的最強語言模型GPT-3,通俗地説,這個AI最擅長的就是生成文字,甚至包括生成一篇像模像樣的小説。

2020年9月,reddit增加了一名新註冊用户thegentlemetre,這名用户每幾分鐘就會在網站的隨機幾個版塊發表一條評論,例如討論Radiohead或者甲殼蟲樂隊,直到這名用户在“你最主要的健身方式”問題下給出了一個莫名其妙的答案:

自從有了AI,我已經開始分不清真假了

後續,這名用户相繼給出了很多奇怪的回答,至此,不少人懷疑thegentlemetre到底是不是真人,有人還通過整理回答內容發現,這名用户幾乎每個回答都是6段話,很符合GPT-3的生成模式。

至此,真相大白,thegentlemetre就是一個AI。

想象一下,如果知道在虛擬空間和你聊天的那個人可能甚至不是真實存在的真人,是不是已經覺得脊背發涼了?

但是AI的本事不僅如此,OpenAI今年又給人送上了一份驚喜大禮:他們在1月初連發了DALL·E和CLIP這兩個連接文本與圖像的神經網絡。在這兩個神經網絡的幫助下,可以通過自然語言操縱視覺概念,比如輸入“一把牛油果造型的扶手椅”,他們就可以通過圖像合成,生成一系列的目標圖像。

自從有了AI,我已經開始分不清真假了

本質上講,DALL·E是基於GPT-3開發的的AI,而GPT-3則是一個自然語言處理模型,機器通過NLP理解了我們的自然語言,在1750億參數量基礎上的GPT-3,現如今已經可以做到更多事情了。

但GPT-3的可怕之處在於其強大的可擴展性,甚至可以用在無代碼開發領域,無代碼就是就是不用敲代碼也可以直接生成程序,GPT-3就是一個強大的無代碼開發平台,只要對它輸入你想要什麼樣的網頁或者app,它就能幫你直接生成。外行人甚至無法分辨生成的網頁是不是程序員寫的。

順帶一提,DALL·E只是使用了120億個參數的GPT-3的小版本,它生成的圖像,你覺得是人類設計師設計出來的嗎?

同樣在在圖像處理領域,Deepfake這個知名的AI軟件作的妖就更多了,它可以將圖片或視頻中A的臉換到B的頭上。其名字由深度機器學習(Deepmachine Learning)和假照片(fakephoto)組合而成。這項技術不需要操作者具備深厚的專業知識,只要收集到足夠素材,AI就可以完成。Deepfake換臉效果逼真,讓人難以分辨真假,堪稱現代“易容術”。

自從有了AI,我已經開始分不清真假了

DeepFake的發展源於生成對抗網絡(GAN)的出現和發展。該算法可以看做是一個基於數據庫自動生成模擬數據庫中數據的樣本,之後通過識別器評估生成數據的真偽,通過生成器和識別器之間的互相博弈與不斷學習,進而產生大量高精度的數據。

因為太過以假亂真,於是有人擔心會有人用到歪門邪道上,事實這些擔心並不是空穴來風,要知道Deepfake第一次亮相就是將《神奇女俠》蓋爾·加朵的臉,嫁接到了一部成人電影女主角身上,此外由Deepfake製作的假視頻已引發多起刑事案件,甚至捲入政治紛爭。

不光是Deepfake,NVIDIA在2018年年底推出過GauGAN用以生成本來並不存在的人臉圖像,而在前年年底,NVIDIA則公開了StyleGAN的2.0改進版,解決了生成圖像偽陰影的同時得到細節更好的高質量圖像。現在我們可以用NVIDIA開源的代碼生成各種汽車、人臉等等圖像,也足夠以假亂真。

種種的種種,都在預示着AI正在朝着越來越像人類的方向演進,上文中提到的灌水機器人是在回答時露出了馬腳,那像Deepfake這種做“假視頻、假照片”的兇手,人類又該如何識破其真身呢?

首先要明白,Deepfake的主要技術分為自動編碼器和生成對抗網絡兩大塊,自動編碼器就是通過神經網絡把一個人的照片特徵抓取出來,然後用數字代表,同時將沒有的表情用數字模擬的方式展現出來。通過訓練,就可以找出一個最好的用數學方式來呈現照片特徵的編碼器。但自動編碼器做出的照片是否自然真實還需要去判別把關,這就需要生成對抗網絡技術,包括兩個機器學習模型,分別為生成網絡和辨別網絡。生成網絡做出假影片,在模型訓練後產生偽造影片;而辨別網絡則不斷地檢視假影片,直至它再辨別不了結果是假的。數據越多,效果越理想,假影片越真實。

自從有了AI,我已經開始分不清真假了

想要辨別假影片的真偽,一個重要的思路就是“用魔法打敗魔法”。Google前年就與科技孵化器JigSaw合作整合了“Face Forenesics Benchmark”項目用來幫助研究人員設計更好的檢測方法;而Facebook則與Microsoft、MIT、Amazon等公司合作共同打擊DeepFake,該項目被稱為“DFDC”,旨在創建能用於“打假”模型訓練的開源工具;12月,Facebook的人工智能研究部門宣佈已經開發出一套反識別系統以辨別實時影像的真偽。

除此之外,也有通過眨眼率、語音和嘴唇運動的同步狀況、情緒來判斷的方法,但本質上講,隨着Deepfake技術的進步,加強對樣本的學習之後,這幾招就失靈了。

科技的發展為人們帶來了很多便利,AI也是如此,我們在享受新興科技帶給我們的便利的同時,也要留心技術濫用可能帶來的潛在風險,目前幾乎沒有任何工具可以幫助讀者確信其在網上看到的信息來源可靠,且沒有被篡改,下次在網上看到一張圖片或者影像時,不妨思考一下:這是不是AI生成的?

(7609676)

版權聲明:本文源自 網絡, 於,由 楠木軒 整理發佈,共 2308 字。

轉載請註明: 自從有了AI,我已經開始分不清真假了 - 楠木軒