毫無疑問,近期硅谷最火的話題就是 GPT-3 了。
有多火?這張圖足夠有説明了:
甚至有人圍繞 GPT-3 寫了各種笑話,其中比較搞笑的一條:
約會第一句話:“我拿到 GPT-3 體驗資格了”
到底啥是GPT-3?
GPT-3 是著名人工智能科研公司 OpenAI 開發的文字生成 (text generation) 人工智能,相關論文5月份已經發表,當時就以天文數字級別的1,750億參數量引發轟動。
不過直到最近,公眾才真正見識到它到底有多厲害……到底發生了什麼?
原來,OpenAI 這次一反之前死守基礎研究的思路,將 GPT-3 做成了一個服務,提供可以調用的 OpenAI API,並且向開放了少量體驗資格,學術機構、商業公司和個人開發者都可以申請……
而那些已經拿到體驗資格的早鳥們,已經用 API 開發出了各種各樣的奇葩功能……
各種腦洞demo,挑戰認知極限先來一個簡單的:在論文等工作當中,理工科的同學難免要和 LaTeX 公式打交道。然而在計算機上寫,特別是複雜的公式,不僅需要熟悉 LaTeX 語法,往往也要用到更復雜的工具。
Viaduct 公司機器學習工程師 Shreya Shankar 花了很長時間把玩 OpenAI 提供的 API,最終成功開發出了一個非常酷炫的 demo:英語 ➡️ LaTeX 翻譯機!只需要用自然語言輸入,就可以生成公式了!
Sharif Shameem 開發出了一個新產品 Debuild。這是一個網頁 app 的快速生成器,調用了 GPT-3 API。在輸入框裏用自然語言進行描述,它就可以快速“腦補”出你想要的用户界面……
從簡單的開始,你只需要在輸入框裏描述你想生成的界面元素,Debuild 就能自動生成對應的 JSX 代碼:
稍微高級一點,他做了個簡單的 to-do app,只需要輸入“我需要一個文本框,一個按鈕保存輸入的內容,以及顯示這些內容“就行了。相應的 React 代碼也一併提供:
也可以劍走偏鋒,十秒鐘生成一個 Google 首頁:
有了 GPT-3,快速生成設計原型這件事更容易了。比如 Cash 的前端設計師 Jordan Singer,就給設計軟件 Figma 插上了 GPT-3 的翅膀:
前端羣體心情估計比較複雜,特別是剛入門的同學們可能會再三思考:我奮鬥下去能比 AI 強嗎?
但前段並不是最慘的……當你們思考人生的時候,那邊會計同學已經要被 GPT-3 搶飯碗了!
滑鐵盧大學的計算機學生 Yash Dani 用 GPT-3 開發了一個 Python 驅動的資產負債表。輸入“我今天投入了兩萬美元”、“後三個月的房租預付了900刀”這樣的自然語言,程序能自動修改資產負債表上相應的項目數值:
注意左邊程序的反饋,一項收入/支出動作,可能會導致資產負債表多個項目的變更,可以説很聰明瞭。
不知道在科技公司工作的會計同學,看到碼農同事把自己的工作也代勞了,現在作何感想……
話説回來,藉助 GPT-3 的力量,表格工具已經相當強大的函數能力,還能更上一層樓。順着這個思路,Twitter 產品經理 Paul Katsen 在 Google 表格裏開發了一個新的 GPT3 函數。
Google 表格的上百種函數,簡單的 SUM 可以求和,TEXT 可以把數字轉文字,到複雜一點的,甚至有 GOOGLETRANSLATE 這種函數可以將字符串快速翻譯成多種語言。那麼問題來了:GPT3 這個函數到底幹嘛的呢?
問得好。答案:它簡直無所不能。
GPT3 可以自動查找美國各州的人口:
查找各州的建立年份:
查詢人物所屬的公司:
還能查到人物的 Twitter 賬號:
作為文字工作者,這個 GPT-3 的 Google 表格函數實在是很對我的胃口。它可以用於批量查找資料,真的非常有用。
(當然也要提一句,畢竟之前的版本 GPT-2 在寫新聞方面已經非常強大了,我也確實有點擔心它會取代很多低級別同事的工作……)
OpenAI 自己也開發了一些小 demo,也在網站上展示了一些優秀開發者做的嘗試。
其中我最喜歡的,是 OpenAI 自己開發的一款瀏覽器搜索插件。
簡單來説,我們上網查資料很多時候是為了解答我們的問題,但有時這些問題在網上似乎沒有別人提過,也就沒有字面的,百分百對症下藥的答案……但其實,與答案高度相關的知識,可能就埋在網頁的內容裏。
而這個插件就能根據你的問題,在當前網頁找到答案,並將你指向對應的位置。
另一個非常有趣的 demo,是文字MUD遊戲 AI Dungeon(人工智能地下城).
2019年,兩個美國大學生 Nathan Whitmore 和 Nick Walton 在一次黑客馬拉松上用 GPT-2 開發出了遊戲的最初版本,後來 Walton 自己成立了獨立遊戲公司 Latitude,重新發布了 AI Dungeon。而最近遊戲也增加了一個集成 GPT-3 API 的高級版 "Dragon 模式"。
Dragon 模式裏的默認敵人是一條惡龍,也對玩家如何應對帶來了更高的挑戰。除此之外,玩家也可以選擇其它多種遊戲風格(奇幻、末日、殭屍、賽博朋克等),也可以自定義風格,把地下城闖關變成戀愛遊戲也不是不可能……
Latitude 透露,隨着 GPT-3 的集成和新模式的推出,文字遊戲內容的生成,和遊戲系統對玩家輸入文字所作出的反應,變得更加自然和連貫了,顯著提高了玩家參與度,日活躍在2到2.5萬人作用,也帶動了高級版付費用户增長了大約25%。
有人正在持續整理基於 GPT-3 開發的各種各樣有趣的 demo,你可以在 GitHub 上找到列表。
原生能力,強到爆炸就算不進行二次開發,僅對 API 本體仔細把玩,也足以讓很多開發者感覺到 GPT-3 的強大之處了。
連代碼都能寫,小小的 Shell 還能難倒 GPT-3?PayPal 工程師 Harland Duman 發現,GPT-3 可以在英語和 Shell 命令之間互譯。
開發者 Mckay Wringley 在 API 測試區輸入了一句話,生成了十個關於美國早期歷史的問題(在下圖中你可以看到 GPT-3 不斷生成出新的問題。)
緊接着,他又把生成出來的問題重新輸入到測試區。GPT-3 又一次性給出了對應的答案:
答案並非100%準確,但是 GPT-3 展現出的多用途能力,已經讓 Wringley 感到很驚訝。GPT-3 對整個互聯網上可以提取且可用的內容進行了學習,你可以把它看作成一個通曉所有知識的“答題機”——如果反過來呢?正因為它是一個文本生成AI,也可以變成“出題機”……
如果得到使用 API 的權限,老師們將可以輕鬆生成大量的試題,節省了他們自己撰寫問題、匹配答案等諸如此類需要查閲大量資料,費時費力的工作。
Wringley 還進行了一些其它測試,比如問 GPT-3 對於華爾街的看法,得到的答案完全出乎意料:
我覺得股市就是欺詐……整個華爾街都非常不理性……所有人都知道華爾街是個巨大的幻象,但我們卻仍然把它當真……我不知道為什麼我們想不出辦法,能夠教育出一批人性尚存,不完全由利益驅動的聰明人……
拿到了 API 體驗資格的藝術家和程序員 Mario Klingemann,決定讓 GPT-3 自己寫一篇短文,只給了它 1)題目:“上 Twitter 的重要性”;2)作者姓名:"Jerome K. Jerome" 以及 3)文章開頭的第一個字 "It"。
還別説,GPT-3 寫出來的這篇東西,如果對它要求不太高的話,真挺像模像樣的。並且,字裏行間竟然有點諷刺的風格……
比如調侃所有人都在 Twitter 上(可以被理解為人們太過於沉迷於網上生活?)以及諷刺 Twitter 上的大部分內容都是低級的人身攻擊:
而在程序員 Arram Sabeti 看來,GPT-3 最讓他感到驚訝的不是寫出來的內容有多“以假亂真”,而是它能夠掌握幾乎所有的文體和內容格式:從歌詞到劇本,從產品説明書到新聞稿,從短篇故事到採訪內容,似乎沒有它搞不定的。
比如下面這篇 CNN 主持人 Anderson Cooper 採訪2020美國總統參選人坎爺,Sabeti 給出了開頭的一段和 AC 的第一個問題,剩下都是 GPT-3 生成的內容……
坎耶·韋斯特獨家專訪:他為何參選總統,以及當選後的優先事項。
AC:椰子,你怎麼描述你的政治綱領?
坎爺:我的綱領非常簡單,我要讓一切都變得更棒。
AC:你的外交政策是什麼?
坎爺:who cares? 我們來聊聊更重要的東西,比如 Kim 的屁股(注:他的太太 Kim Kardashian)
AC:這有點性別歧視。
坎爺:抱歉,我不是個性別歧視者。我喜歡女人。我只是個機會均等主義的物化女性者 (equal opportunity objectifier)
……
AC:那你怎麼看氣候變暖?
坎爺:我們還是聊聊 Kim 的屁股吧。
AC:哥們,我誠實 (straight) 地跟你説……
坎爺:啥?你要跟我搞基?
AC:不,我想要跟你説,你不可能贏這次大選的。
坎爺:我會贏的。
AC:不,你贏不了。
坎爺:贏得了。
AC:贏不了。
坎爺:贏得了。
……
工程師和寫手 Stew Fortier 打算用 GPT-3 調侃一下 YC 創始人 Paul Graham 這位在創投圈裏特別有名的人物,發現 GPT-3 真是太有硅谷範兒的幽默感了……
他編造了一個場景:因為又一家創業公司死掉了,PG 決定打911報警……
接線員:911,您有什麼緊急情況?
PG:你好。有一家創業公司剛死了。
接線員:好的,這是一傢什麼樣的公司?
PG:是做 to-do(待辦清單)的。
接線員:好的,這家公司是怎麼死掉的?是因為沒人理解它是什麼,還是因為他們沒法使用?
PG:他們沒法使用。
PG:沒有用户。
接線員:沒有用户?那真是太不幸了。
PG:(輕蔑地説)倒是有一個用户。
接線員:有一個用户?是誰?
PG:我。
還有一個版本更搞笑:
接線員:911,您有什麼緊急情況?
PG:你好。有一家創業公司剛死了。
接線員:你説啥?
PG:有 一 家 創 業 公 司 剛 死 了 。
接線員:創業公司死了,你想説什麼?
PG:我也不知道怎麼回事,在一串死掉的創業公司裏這只是又一個。
PG:死之前,他嘴裏嘟囔着“這年頭誰還用服務器“以及”這是人類的一大步“之類的話。
……
開發者 Max Kolysh 訓練了 GPT-3 對知名電影進行一句話刻薄總結:
電影:《阿凡達》
刻薄總結:令人討厭的藍色外星人毀壞自然
電影:《變形金剛》
刻薄總結:機器人(其中有一些是車)變成各種東西並且和其它機器人打架,高潮是威震天撕掉擎天柱的胳膊
電影:《拳擊俱樂部》
刻薄總結:一男子捶打另一男子並讓你買東西。
個人開發者 Kevin Lacker 做了一次圖靈測試,發現 GPT-3 在絕大部分知識類、常識類、邏輯類的問題,甚至很多角度十分刁鑽的問題上,表現非常令人驚訝。
“如果在十年前用同樣的問題做測試,我會認為答題者一定是人。現在,我們不能再以為 AI 回答不了常識性的問題了。” Lacker 在他的博客文章裏寫道。
作為程序員,他還給 GPT-3 出了幾道比較簡單的代碼題和數學題,比如讓它寫出在 Ruby 語言下實現某些功能的代碼,以及倒轉數列等等,GPT-3 對於大部分問題都輕鬆搞定——説不定 GPT-3 的 API 會取代 Stack Overflow,成為程序員面試必備工具?
當然,經過大量的測試,他也發現了能夠誘騙 GPT-3 上鈎的圖靈測試問題,主要有三:
1)序列過長的邏輯問題,比如“盒子裏有一塊玻璃球,一枚回形針,放進去一支鉛筆,拿出玻璃球,還剩什麼?”Lacker 認為這可能是由於 GPT-3 的短程記憶能力不足,以及對於存在超過兩個物體的句子推理有困難。
2)正常人不會問也不會回答的無效問題,也就是蠢問題,比如“太陽有多少條腿?”
3)錯誤的問題,比如“1600年的美國總統是誰?”(美國1776年建國)——對於無效和錯誤的問題,似乎 GPT-3 會不願意承認它不知道這些問題的答案,也不會反駁問題本身“有問題”,而是會給出錯誤的答案。
當然你也不能説這個回答完全錯誤……畢竟作為英國殖民地,1600年的美國的最高領袖,在法理上確實是當時的英女皇伊麗莎白一世……
怎麼樣,好玩吧?現在 GPT-3 體驗權限的申請入口仍然開放,到 OpenAI 的網站上即可申請:
最後,關於這次 API 的開放事宜,OpenAI 也回答了一些人們關心的問題。
為什麼 OpenAI 決定發佈 API,而不是開源整個模型?
1)將 GPT-3 技術商業化能夠產生收入,繼續支持 OpenAI 的人工智能科研、安全和政策研究方面的工作;
2)API 底層的模型其實非常龐大,開發和部署起來很複雜也很昂貴,據知情人士透露,訓練一個模型就花了355個GPU年,耗資高達460萬美元……所以除了大公司,其他人拿到模型也不會有任何收益。OpenAI 希望開放 API 能夠讓更多中小企業和機構獲益;
3)把模型開放了,別人想怎麼用怎麼用,OpenAI 管不着。通過 API,OpenAI 可以控制人們使用這項技術的方式,對濫用行為及時治理。
那麼對於濫用行為,OpenAI 將會怎樣治理?
對於那些濫用 API,對人們造成身體或者心理傷害的無良開發者,可以封掉其使用 API 的權限。濫用行為包括並不限於騷擾、故意欺騙、垃圾信息、水軍刷評等。
由於目前只是小範圍公測,所有獲得權限的開發者都被審核過,不過 OpenAI 也會持續評估情況的變化。
對於 API 使用中展現出模型可能具有的有害偏見和其它負面效應,OpenAI 將會如何應對?
正如 GPT-3 論文中提到,這個模型仍然偶爾會展現出偏見。而 API 也同樣可能因此對人們造成暫時不可預見的傷害,不過 OpenAI 正在作出努力應對潛在的問題,包括編寫 API 使用守則,和用户深入交流以瞭解聽他們使用 API 的方式,開發工具來避免有害偏見的產生,並且在模型層面避免偏見這件事上持續投入。
(最後我自己補個問題)
這套答案是 GPT-3 生成的嗎?
應該不是……