站長之家(ChinaZ.com) 10月28日 消息:近日,B站up主圖靈的貓發佈了一則視頻稱,自己一人歷時100天花費近500個小時,訓練出了一個會寫作文的人工智能Essaykiller,Essaykiller由17億參數、2億數據、1萬行代碼組成。
據介紹,Essaykiller是一個基於OCR、NLP領域模型所構建的生成式文本創作AI框架,目前第一版finetune模型針對高考作文(主要是議論文),可以有效生成符合人類認知的文章,多數文章經過測試可以達到正常高中生及格作文水平。
Essaykiller由4個神經網絡組成,包括了:
第一部分的識別網絡,通過外接攝像頭的實時OCR以及卷積神經網絡進行漢字的識別與提取。第二部分語言網絡分為兩個子網絡,一個網絡負責讀題能力,另一個負責寫作能力。後者為整改AI的核心。第三部分為判分網絡,取出Essaykiller生成的多篇文章中,打分最高的一篇文章進行輸出。
圖靈的貓稱,搭建完上述架構後Essaykiller就算出生了,Essaykiller借鑑了Alpha Go的設計理念,只要0.1分鐘就可生成多篇文章,可利用API調用單獨的神經網絡,對一百篇作文進行通順度打分。
隨後,圖靈的貓對Essaykiller進行了大量的訓練:閲讀了大量的優質散文、議論文、歷年高考滿分作文等進行訓練。Essaykiller共學習了360萬張圖像數據、2億條中文預訓練語料、上千篇微調文章。
但在訓練的過程中卻出現了小插曲。
圖靈的貓稱,由於自己的RTX2060S顯卡經受不住這麼大的網絡規模以及計算量,導致內存“爆掉了”。據悉,Essaykiller的神經網絡達到了17億之多,已經超越了目前市面上可見的任何一個單GPU的運算內存限制。
在嘗試了2080ti、谷歌TPU V3、Tesla V100之後,圖靈的貓最後找到了RTX8000--目前世界上最大單卡顯存的顯卡,解決了這個問題。
最終!!Essaykiller在137個小時之後,學習完了全部的內容。
圖靈的貓對兩個地區的兩個全國卷的作文進行了測試,並通過高考格式排版腳本利用改裝後的外接裝置對文本進行輸出,宣佈大功告成。
值得一提的是,目前該up主已經將這整個項目開源,並上傳到了Github,同時還將訓練好的Al遷移到了線上服務器,大家只要進入網頁輸入題目或者句子Essaykiller就會生成獨一無二的文章。
感興趣的用户可以>>>點此訪問<<<