沈向洋：讀論文的三個層次

5月14日，沈向洋博士在全球創新學院（GIX）課程上曾做了一場線上公開課《You are how you read》，分享他對於科研論文閲讀、撰寫的寶貴經驗，引起一時轟動。由於圍觀網友太多，導致會議系統崩潰，眾多網友無法接入觀看，不免唏噓不已。近日，為滿足廣大網友的需求，微軟亞洲研究院將沈向洋博士的報告視頻公開。這場報告亮點紛呈，引人深思。

沈向洋博士在報告如是強調持久閲讀的重要性。

沈向洋博士如是強調論文閲讀中“懷疑一切”的精神。科研離不開日常讀論文；而讀論文絕不僅是“下載、打開、閲讀”這樣的被動操作。我們不妨來看一看沈向洋博士的論文閲讀經驗。

AI科技評論針對沈向洋博士的報告內容，做了有刪改的編譯，感謝沈向洋博士對本文的親自修改和確認！

沈向洋：

在研究生院讀書是人生中最美好的時光，在這段時間你可能沒有足夠的錢，但是卻有足夠的時間學習。在讀書的這段時間應該學習一些重要的技能，比如有效的閲讀、寫作和演講。

閲讀是每一個人生活中必不可少的部分，尤其是對正在讀書的研究生來説，他日常的任務可能就是讀一些論文，看一些期刊等，但是高效的閲讀並不容易。

在過去的20年的時間裏，我培養了三十多個博士生，有一些學生能夠出色地完成閲讀工作，但也有些學生覺得有困難。閲讀論文確實很難，這裏面可能有很多的原因。

首先可能是論文本身寫的不是特別好，因為大多數作者的母語並不是英語，而英語又是大多數研究論文的官方語言，所以一些作者在論文語言把控上欠缺火候。

我也是把英文作為第二語言的人，我的論文寫得也不夠好，現在回過頭看看我早期寫的論文，真希望當初自己不要寫那些論文。

第二個原因是在讀論文的時候，讀者需要對論文主題有很深的背景知識。

還有，當你在閲讀中遇到困難的時候，應該從哪裏尋求幫助呢？可以向誰尋求幫助？能夠獲得什麼樣的幫助？

另外，現在在網上很容易找到與你閲讀相關的東西，所以坐下來長時間專注於閲讀一篇長文章或者一本書變得比以前困難很多。

JonathanShewchuck教授在CMU攻讀博士學位時候曾經寫下過一句話：從所閲讀的論文中提取中心思想，就像一句諺語所説“從針眼裏吸出一頭駱駝”（sucking a camel through the eye of the proverbial needle）。這個比喻非常恰當，以至於我讀到這句話的時候也是眼前一亮。

相關文章鏈接：http://www.cs.cmu.edu/~jrs/sins.html

在那篇文章中，Jonathan指出了CS和數學領域寫作的三個常見錯誤，分別是“祖母式”的引言（意思是引言絮絮叨叨，沒有直入主題）、段落式的目錄結構、不切題的結論。當然，這三個觀點對於寫作非常重要，但我們今天的主題不是它，我們今天的主題是：如何閲讀。

説實話，有些論文寫得確實不好，但寫得不好的論文你也要讀，因為有時候你沒有選擇。其實，論文閲讀之所以難，最主要的原因是閲讀和寫作脱節，也就是作者和讀者之間的脱節。

作者一心想把東西“拿”出來，而讀者一心想從文章中得到一些東西，這裏面必然有理解的偏差。幾千年來，自從語言出現並開始寫作至互聯網（以及社交網絡）出現之前，一直有此困境，即寫作只是從作者到讀者的單行道，沒有循環反饋渠道。

例如，直到現在人們還在爭論孔子寫過的那些文字到底是什麼意思。

仔細想想，這類似於香儂的信息論原理，論文是作者和讀者之間交流信息的渠道，實際上主要是單向傳輸。更為具體一些，寫作就像編碼，閲讀就像解碼，所以需要一本Codebook來介紹“編碼”到“解碼”所需要的知識，也即作者按照這本Codebook中的規範進行“編碼”，閲讀者則用它來“解碼”。其實，香儂理論只是概括了閲讀與寫作的一部分，真實的閲讀往往超越了傳統的“傳輸-壓縮”框架，它更多的是一個反覆的理解過程。

在這個過程中，讀者將作者的意圖(信息)解釋成能夠理解的片段，隨後這些片段被構建到讀者腦中的認知模型裏。所以，閲讀等同於理解，不同層次的閲讀對應不同層次的理解——深度閲讀導致深度理解，淺顯的閲讀對應的必然是淺顯的理解。

知道了閲讀的本質，那麼我們應該如何對待閲讀呢？不同需求應該對應不同的閲讀層次，你可能需要快速瀏覽，可能需要仔細閲讀，如果你的導師需要你復現論文中的細節，那麼你就需要非常深入地研讀。

快速閲讀：劃分結構層次

對於快速閲讀，一個小的技巧是圖文瀏覽。因為一些好的論文必然是圖文並茂，所以只要弄清楚論文中表格和圖片的標題和註釋，就能夠獲得這篇論文八、九成的信息。

對於仔細閲讀，你的心態必須是批判和創造的。精讀一篇論文，首先要對論文進行否定、質疑，仔細挑毛病；其次，對論文有了足夠的瞭解之後，如果發現論文中提到的想法非常優秀，那麼要創造性地思考你能用這篇論文做什麼。

除了閲讀的方式，讀者還要理解所讀的論文是如何寫出來的。因為一篇好的論文在邏輯上是層層遞進的，不僅能夠傳達信息也能夠激勵讀者。

所以作者在寫的時候也是有結構化的邏輯性思考程度的。總體上作者會思考：這篇論文的真實任務是什麼、研究發現是什麼；論文的貢獻是什麼等等。相應的，讀者在讀論文的時候也應該要有邏輯，首先要清楚論文中的表達是否是我想要學習到的；其次，我能從論文中學到多少呢；最後，這篇論文的背景是什麼——是什麼樣的背景讓這篇論文變得重要和有趣。

論文結構化的層次只是微觀層面，在宏觀層面上，讀者還需要了解論文的類型：1、提出問題型論文；2、解決問題型論文；3、闡述和調查型論文。

講完了論文的類型和邏輯結構，接下來進入關於快速閲讀和仔細閲讀的細節介紹。著名科學家Don Geman曾提到：一篇論文實際上有標題、摘要、引言、論文主體（The restof the paper）組成，論文四個部分的每一部分都需要花同樣的時間進行撰寫。所以，對論文進行快速閲讀需要着重關注論文的標題、摘要和引言，如此便能瞭解論文是否值得讀、能夠從論文中讀到些什麼。論文最重要，也是最難寫的部分是引言。

我的前同事，微軟美國研究院的著名圖形學專家Jim Kajiya在他的一篇著作”How to get your Siggraphpaper rejected”中強調：你必須要下功夫把引言寫好，寫到審稿人容易看懂。這篇論文是關於什麼的，它解決了什麼問題，迷人之處在哪，有什麼新的東西，為什麼那麼神奇。

《How to write a good paper》：

https://www.cc.gatech.edu/~parikh/citizenofcvpr/static/slides/malik_write_good_paper.pdf

如何讀論文的引言？舉個例子，我最近在讀《擁有倫理學：企業邏輯、硅谷與倫理學的制度化》（Owning Ethics：Corporate Logics, SiliconValley, and the Institutionalization of Ethics），在引言部分，我問了Kajiya的幾個問題。

首先這篇論文講的是高科技公司在道德方面做了什麼；其次，解決的問題是現在的實踐（擁有道德）做法；再者，迷人之處在於最近的醜聞和技術後衝（techlash）；這篇文章的最新之處是對17位“道德擁有者”進行了採訪；最後，整體的邏輯是道德所有者在令人擔憂的動態中運營公司。所以，一旦把引言分解成這些東西，然後你就可以決定：這是有趣的嗎？應該繼續讀下去麼？

如何讀摘要？計算機學科論文中的摘要一般是非常枯燥的，如果一行一行的讀，那麼將會更加枯燥。所以要讀摘要的時候，將其分解並加上一些有趣的亮點，便可能利於閲讀。

舉個例子，在《可信度指標對社交媒體新聞分享意願的影響》（Effects of Credibilit Indicators on Social Media News Sharing Intent）論文中摘要部分，主要講了社交媒體有可能傳播假新聞，對這些媒體加上可信度標記可以減少人們分享假新聞傾向。瞭解文章的主題之後，然後你需要問自己這篇論文真正的發現是什麼？通過繼續閲讀，你發現論文探究了四種可信度指標，每種可信度指標都能夠減少人們分享的傾向，一些審查工作也能帶來積極的效應，進一步發現，人口統計和個人特徵以及社會特徵會對可信度指標產生顯著差異的影響。

瞭解了這篇論文研究成果之後，接着問自己：我為什麼要關注這個問題。接着讀發現，原來這篇論文的研究成果對遏制虛假信息的傳播有着重要的影響。考慮到目前美國信息傳播的現狀，這對節省研究員的學術精力非常重要，所以對於我來説，我應該關注這個問題。

接下來簡單介紹標題如何讀，標題一般只有一句話。從整篇論文的排版的角度來看，在一頁半的引言、四分之一頁的摘要以及八頁的雙欄正文面前，只有一句話的標題顯得不太“重要”。但是標題是總結、抽象的概括。除了論文標題，圖表的標題也是非常抽象。我曾經嘗試只用兩個高度概括的詞，並以ing結尾來做Siggraph論文的標題，例如Plenoptic sampling、Lazy Snapping、Poisson matting。所以對於讀者來説在讀這些抽象的詞或句子的時候，只有花費較多的時間才能讀懂論文作者的意圖。以上是快速閲讀的一些技巧，下面轉向仔細閲讀。

仔細閲讀：批判思維

以評判性閲讀開始，帶着質疑的心態問問題。如果作者論文中聲稱解決了一個問題，那麼你就要在心裏問自己：論文是否正確、真正地解決了問題？作者論文中所用方法是否有侷限性？如果所讀的論文沒有解決問題，那麼我能解決麼？我能採用比論文中更簡單的方法解決麼？所以，一旦進入仔細閲讀的狀態，要在讀論文之前對自己説：這篇論文可能有問題，我要找出來。

批判性閲讀可能非常難，也可能佔用你很多的時間，你可能在讀的過程中被卡住，但不要驚慌失措，要堅持下去！多找一些背景知識閲讀，多做筆記，多在網上搜索相關論文，然後再次通讀所卡殼的論文，並試着把它與其他論文相聯繫起來，如此堅持下去，定能渡過難關。另一個建議是，找熟悉這方面工作的人幫忙，讓他們解釋你遇到的難點。

但你要意識到找人幫忙也可能遇到困難，一方面，你要找誰幫忙，導師？師姐？學長？另一方面，如何能讓他們愉快的接受你幾分鐘、十幾分鍾、甚至接近一個小時的諮詢？這一點，對於我來説非常幸運，我在CMU讀研究生的時候，我身邊的同學和教授都非常友好，尤其是一個比我稍微年長的學長，他的學識比我豐富許多，每當我問他一些論文方面的事情時候，他總能給我令人驚歎的答案。

我從他那學到的其實不光是我應該看哪些論文，更多的是不應該看哪些論文。他會告訴我某人的論文你不要讀，因為那會擾亂你的思路。

創造性閲讀：積極思考

好了，現在你已經知道了如何進行批判性的閲讀，以及確信哪些論文值得讀下去，甚至在讀的過程中可能會產生一些好的想法。那麼接下來要做一些改進，從而進入創造性閲讀層面。這時候你要問自己：在我所讀的論文中，作者有哪些點還沒有想到？如果我現在做這項研究，我能做的新事情是什麼？

創造性的閲讀需要把你所讀的論文和其他相關的論文建立聯繫，從而產生一些新的想法，這些想法可以支撐你進行三個月到五個月的研究。如果你真正想理解你所讀的論文，那麼就寫一個摘要吧，最好做一個口頭展示，這樣你會發現，只有把東西寫下來或者説出來才能真正深刻理解。如果你能做一個報告，那就更好了，因為做報告的時候，別人可以問你問題，這會強迫你理解所讀的論文。

在做這個演講之前，我曾經向我的同事、學生詢問了關於論文閲讀有哪些問題可以“問自己”，上面這張圖片是一個總結，圖片的上半部分是比較客觀的問題，包括論文的核心觀點是什麼？主要的侷限性是什麼？代碼和數據是不是可得的？論文的貢獻是否有意義？論文中的實驗是否足夠好？

圖片的下半部分是比較主觀的問題，包括我錯過了什麼相關論文麼？這對我的工作有何幫助麼？這是一篇值得關注的論文麼？這個研究領域的領頭人是誰呢？其他的人對這篇論文有何看法呢？如果有機會見到作者，我應該問作者什麼問題？當你在閲讀論文的時候如果能回答出上面列出的問題，我相信你會對你所讀論文有非常深刻的理解。

此外，還有一些工具能夠幫助閲讀，例如谷歌以及必應網頁搜索引擎、谷歌學術、arXiv等能夠搜索到你想要的論文；OneNote可以幫助你做筆記；CliffsNotes作為美國知名的學習指南網站，能夠提供文獻學習指南；Mendeley是非常優秀的參考文獻管理。另外也強烈建議大家使用在線論壇討論論文，增加學術交流，增強對所讀論文的理解能力，但是遺憾的是，尚未有非常適合討論論文的在線論壇，現在的一些社交網絡產品或許很棒，但是它並不是為了學術研究目的而設計，畢竟學術論文的“非有趣性”不適合社交產品的調性。

最後，上面有幾個小貼士希望你注意。我最想強調的是要養成寫小總結的習慣，最好能做報告，這樣真的能夠增加你對所讀論文的理解。或許你永遠不知道你以前讀過的書能在什麼時候能夠派上用場，但是請保持閲讀，因為閲讀的過程也是在你大腦中建立認知的過程。

（雷鋒網）、（雷鋒網）、（雷鋒網）