機器人來了,記者走了……
刺蝟公社 | 石燦
8月8日21時19分,四川九寨溝地震,機器人用25秒寫了全球第一條關於這次地震的速報,透過中國地震臺網官方微信平臺推送,全球首發。
這篇標題為《四川阿壩州九寨溝縣發生7.0級地震》的速報全文585個字,在8月8日21時37分15秒自動編寫。
速報內容包括速報引數、震中地形、熱力人口、周邊村鎮、周邊縣區、歷史地震、震中簡介、震中天氣、產出說明和5張圖片。
(“四川阿壩州九寨溝縣發生7.0級地震”速報)
寫這則速報的作者為“地震資訊播報機器人”,它是國家地震臺網研發的智慧機器人。
這不是它第一次露面,早在2016年5月四川綿陽地震期間,它就用6秒鐘寫下560字速報,整個過程自動寫作,自動釋出,無人介入。
很快,一條題為《綿陽安州發生4.3級地震》的新聞開始傳播開來。內容包含地震引數、震中地震歷史資訊、地震周邊鄉鎮的基本情況、地震所在縣的行政情況,還有兩張震中地圖,圖文並茂,跟這次情況一樣。
據瞭解,“地震資訊播報機器人”並不是人們想象中的實體“機器人”,而是一套能夠執行命令的程式。當地震發生後,這套系統會啟動工作流程,取標題、釋出圖片、寫地震引數......將這些步驟逐一展開,在最短的時間把速報寫出來。
8日當晚,中國地震臺網官方微信發出第一條速報後,截至9日下午6點32分,又連續推送了14條關於地震的速報,均為機器人操盤,最快出稿速度為5秒。
(排列以速報推送時間為基準)
速報的資料地震引數,如震級、震源深度等資訊來自地震臺網。其他背景資料來源不一樣,如震中的簡介、震中所在地周邊鄉鎮、村落等情況,有些是檢索的,有些則是之前就儲存在機器人系統裡。
自中國地震臺網微信平臺今年6月29日上線以來,共傳送了68篇機器人撰寫的速報。
在地震報道領域,機器人早有所作為。由《洛杉磯時報》內部員工肯恩·斯昆克開發,並於2011年投入使用的Quakebot是地震領域自動化新聞的鼻祖和標杆。
2013年3月,Quakebot因為第一個報道南加州發生的4.4震級的地震而迅速引起關注。2014年3月17日,美國洛杉磯發生4.4級地震,Quakebot用3分鐘完成了相關報道的寫作和釋出。
四川九寨溝地震發生後,“地震資訊播報機器人”又一次引發了人們的關注,機器人有一天會替代人類記者嗎?有這幾個問題你需要了解。
機器人目前擅長的寫作領域:財經、體育、自然災害
機器人參與新聞工作,最早可以追溯到2001年穀歌實現個性化新聞推薦,那年,谷歌開創了用機器選編新聞的先河。
可實際上,機器人新聞是“自動化新聞”的通俗說法。繼2014年7月美聯社引進“機器人同事”後,全世界的新聞編輯室紛紛引入自動生成新聞技術。
《紐約時報》《華盛頓郵報》《洛杉磯時報》《衛報》和路透社等西方媒體都走上了自動化新聞發展的道路。
國內,直到2015年9月,騰訊財經的機器人Dreamwriter才正式出道;同年11月,新華社推出“快筆小新”,主打財經新聞;去年,第一財經發布智慧寫稿機器人“DT稿王”。
(截至8月8日下午3點03分, Dreamwriter在當天共釋出了兩篇新聞)
不難看出,自動化新聞格外擅長於財經領域,不過,它在體育領域也毫不遜色。
以“快筆小新”為例,它供職於新華社體育部、經濟資訊部和中國證券報,可以寫體育賽事中英文稿件和財經資訊稿件。多領域同步發展,難不倒自動化新聞。
上述兩個領域和地震領域有著幾個共同點:其一,資料繁多,程式複雜,工作繁瑣,需要花很多精力對資料進行分析,而處理資料是演算法的強項;其二,有相對固定的新聞模版,較為程式化,題材重複性高;其三,這類文章大多不需要大量採訪。
所以,記者到底會不會因為機器人而失業?這是有可能的,但不是所有領域。
《洛杉磯時報》的機器人也誤報過地震新聞
2015年,NPR(美國國家公共電臺)讓一位資深商業記者與寫稿機器人比拼寫新聞稿,雙方就一家公司的最新收益報表出來後,第一時間進行寫作。
最後,機器人花了2分鐘完稿,記者花了7分鐘。在質量上,機器人的稿子獲得912票支援,記者獲得了9916票支援。
(你覺得哪篇是記者寫的新聞稿?)
將記者與機器人的新聞稿做對比後發現,記者的新聞稿以語言豐富取勝。但這並不是說機器人的新聞稿就很差,它的新聞稿反而更加凝練和簡明。
機器人稿件中的這些特徵與“機器人新聞”的工作原理密不可分。
簡單來說,新聞寫作可以分為兩類,一是用模板式寫作,直接往框架裡面新增內容。二是更復雜化、人性化、文學化的新聞。機器人寫稿屬於第一類。
“快筆小新”發稿系統研發團隊成員、技術局高階工程師熊立波在接受媒體採訪時說:“機器人寫稿流程分為資料採集、資料加工、自動寫稿、編輯簽發四個環節”。
技術上透過根據各業務板塊的需求定製發稿模板、資料自動抓取和稿件生成、各業務部門建稿編審簽發“三步走”來實現。
新華社機器人發稿系統後臺有500到600個模版,可以根據不同的要求,呈現不同的稿件。
目前新華社機器人發稿系統運營維護僅需4到5人,平均一天稿件簽發量在100條左右。
總而言之,一條機器人新聞的順利誕生,首先需要清晰、準確、結構化的資料,當資料質量較差時,新聞的報道質量也會受到影響;其次,機器人新聞的報道領域侷限於題材重複的新聞故事;最後,機器人現階段依舊離不開人類干預。
目前需要人類干預的環節包括:制定演算法、提前撰寫新聞模版(語句、段落或是整篇報道)、最終核實環節,等等。
這也意味著,一旦脫離了人類的干預和核實,機器人新聞的準確性可能面臨巨大的挑戰。
當地震或是其他自然災害發生的時候,附近地區的讀者最希望能夠快速、準確地知曉諸如破壞程度、波及地域、時長等資訊,以便及時逃生或是做好避難準備。而一旦地震報道失實,則可能造成不可估計的嚴重後果。
即便是地震機器人新聞的鼻祖Quakebot,仍然多次誤報地震資訊。
2015年3月,南加州的地震儀檢測到了日本、阿拉斯加主要的地震訊號,美國地質調查局錯誤地將其報告為發生在加州的、震級範圍從4.8到5.5的地震。但地震並沒有發生,更沒有人感知到地震。
儘管如此,Quakebot仍然釋出了這三個假地震的報道。
“機器-人類”聯姻模式,或將成為新聞界的未來
除了準確性,目前機器人新聞還面臨著“可讀性”的問題。西方多個學術研究的結果顯示,機器人新聞的可讀性不如人類記者撰寫的新聞。
2014年,瑞士卡爾斯塔德大學的克里斯特·克勒瓦在受訪者不知道文章來源的情況下,觀察和分析人們對新聞報道的質量評估。
研究結果顯示:自動化新聞在可信度方面的排名比人類寫得高,但在可讀性方面明顯低於人類。
具體而言,人類記者撰寫的新聞連貫程度高、撰寫質量高、更清晰、閱讀起來更為愉悅。而自動化新聞則相對無聊,更為描述性、資訊量更大、更為可信和客觀。
不過,隨著演算法的迭代,機器人新聞的可讀性正在日益朝人類記者的水準逼近。2017年,西方學者安德里亞斯·格雷費和馬里奧·海姆,對自動化新聞的接受度和可讀性進行了量化研究。
實驗的研究結果顯示:自動化新聞和人類撰寫的新聞在五個與可讀性相關的指標中,有四個沒太大差別。
即便如此,機器人新聞仍舊因其演算法的侷限,難以完成諸如深度訪談、深度分析等人類記者擅長的工作。
這也解釋了為什麼,就目前的情況來看,機器只會與人類產生更加密切的聯絡,而人機協作是未來發展必然趨勢的原因。
機器人對資料非常敏感,它可以對基礎的資料類新聞進行分析和寫作,節省記者的時間,降低媒體的成本,提高媒體的效率和收益。
需要與人打交道的深度報道,主力是記者,在操作的過程中機器人會幫助記者解決掉很多問題,比如語音轉錄、資料報表分析、製作圖片等等。
寫稿機器人歸類於AI領域,AI威脅論近年來從未消停過。在剛剛過去的7月裡,馬斯克就提出了人工智慧威脅論,他表示在30年之內AI就會超越人類的智慧,後果讓人擔憂。話還未落音,扎克伯格在直播時駁斥了馬斯克的觀點,再次強調AI和諧論。
在AI威脅論同樣盛行的新聞媒體領域,一部分媒體人對寫稿機器人的出現表示擔憂,但更多的人覺得,機器人並不會取代記者,相反會成為記者的好幫手。
所以,在未來,機器人和記者相互協作,才是主流趨勢。即使機器人搶了在某些領域工作的人的飯碗,說到底也是為了推動整個社會的前行。
(賈宸琰對此文亦有貢獻)