楠木軒

王天陽:海市蜃樓還是陰謀論?​經濟數據到底有多不靠譜

由 司空梓瑤 發佈於 經典

【文/觀察者網專欄作者 王天陽】

大家好,歡迎來到金融評書“白話金融危機史”。

最近美國的資本市場可謂是處於癲狂。在經濟停擺社會矛盾風雲變幻的同時,美股已然收復了2020年的絕大部分失地,納斯達克甚至創出新高。從2020年2月19日最高點到3月23日的低點,美股在33天內跌落了近33%,經歷了史上最快的熊市,我戲稱為美股失戀的33天。之後在投資客一片驚呼中美股一騎絕塵,很快就走出了失戀的陰影,又迅速創下了史上最快的牛市。

金融市場先於經濟基本面開始的深V型反轉,是春江水暖的先知還是終將破滅的海市蜃樓,就要看美國經濟是否真的能如股市所預計的迅速反彈了。而美國剛出爐的意外新增就業,無疑為經濟的反彈畫上了一個濃眉大眼的對號。

先説這個數字有多意外吧,此前美國在疫情中被廣泛報道了近4000萬人的失業和4月份高達14.7%的失業率,美國很多媒體預測5月將會有800到900萬新增失業人口,失業率達到1929年大蕭條以來最高的20%,而且很快就有可能會超過1933年大蕭條頂峯時期每4個美國勞動力就有一個失業的25%。

出乎很多人預料的,5月份的數據一出來,非但沒有新增800萬失業,反而是新增了250萬就業,是美國有記錄以來的最大單月新增就業。在政府部門大幅減少了58萬就業的情況下,休閒旅店建築等部門都大規模增加了就業。

5月份13.3%的失業率也在疫情後首次出現了下降的趨勢。

可想而知,這種通常在電影裏才會出現的大反轉情節立刻刺激了各方的神經。Trump政府和國會喜上眉梢自不必説,都紛紛宣稱救助法案起到了效果。Trump在玫瑰園更是高興地説,遠超預期的數字説明經濟恢復如同做上了火箭,甚至比V型反轉還要好。

股市更是被封為先知,火上澆油,為後面幾天更為瘋狂的上漲開了綠色通道。

而質疑的聲浪也迅速開始傳來,認為實在是好到不可置信,It is too good to be true。

首先的質疑來自諾貝爾經濟學獎得主保羅·克魯格曼(Paul Krugman)。克魯格曼在Twitter上公開懷疑美國的統計局(Bureau of Labor Statistics (BLS))有可能被Trump政府做了某種工作才做出這麼亮眼的數據,陰謀論呼之欲出。

以克魯格曼的諾獎身份和影響力親自下場開撕,此言一出自然是火花四濺。要知道他質疑的可不只是一個經濟學的統計數字,甚至也不只是他一直以來都在批評的Trump政府,他質疑的是整個生產這個經濟統計數字的機構和整個流程,而這個機構應該是無黨派的,這個流程應該是專業的。

克魯格曼的質疑本身引來了更加排山倒海般的質疑,迫使他在一小時後便不得出面道歉,並承認説開始相信增加的就業是真實的。但他同時又不肯罷休地立刻補充説,即便有新增就業也不代表美國經濟走出了黑森林,一旦政府提供的補貼過期後,經濟將會重回地獄。

質疑的人遠不只是克魯格曼,比如2004年參加過民主黨總統競選的前Vermont州長Howard Dean也發推説“You should ALWAYS assume trump lies”,必須要時刻假設Trump會撒謊。他同時質疑統計局不是中立機構,並憑直覺認為真實的失業率數據應該是在17-19%之間。

被飽受質疑的統計局專家們當然就要出來走兩步了。主流媒體很快採訪跟進報道,首先當然是否定了陰謀論,受訪的經濟學家認為統計局沒有被運作,並不存在政治影響和違規操縱的問題。統計局的局長William Beach(BLS Commissioner)在接受華盛頓郵報採訪時説這些指控不僅是荒謬的,而且透露出對統計局工作的巨大無知。

如果不是陰謀論,那怎麼解釋此前預測出新增800萬失業的經濟學家錯的離譜了呢?華盛頓郵報專門指出這位統計局長是Trump總統在2019年任命的,意有所指,而且統計局的報告裏還有一條不同尋常又耐人尋味的説明。這條不同尋常的説明指出,因為有可能有數據分類的誤差,真實的失業率有可能其實是在16.3%,比13.3%整整高3個百分點,耐人尋味吧。

這就奇怪了,為什麼統計局一方面正式發佈13.3%的失業率,同時又説有失業率可能是16.3%呢,這究竟是什麼操作?

問題出現在該怎麼界定一個人是失業還是就業上。理論上一個人要麼根本不在就業市場,只要在就業市場上就要麼失業,要麼就業。可惜的是,理論總是過於簡單化的,真實的世界卻無比複雜。就好像我們小時候學牛頓物理,一句假設沒有摩擦就可以省去了多少有關現實的討論,而沒有摩擦的假設是不可能把火箭發到太空的。我們現在很多經濟學家也常常會像中學物理一樣,一句假設經濟人都是理性的、假設市場都是有效的,然後就可以在這個沙灘上用高明的數學建成一座座美麗的沙塔。

這就要説到這美國失業率的數字究竟是怎麼得來的了。聽起來高大上的全國失業率,其實並不是真正的全國失業率,而是一個通過小樣本來估計出來的。有多小呢,在全美1億2858萬個家庭中抽樣6萬個家庭。這就有點像人口普查和總統大選的政治民調,全國人口普查耗時費力通常10年才做一次,大選的政治民調也不可能問到每一個選民,這些平時只能都做小樣本的抽樣調查。既然是小樣本抽樣自然就會有誤差,怎麼少抽樣又能低誤差就是統計學的大學問了。

咱們用美國大選的政治民調舉個例子大家就能知道,這種抽樣調查有可能錯的有多離譜。現在説到民調大家熟悉的是蓋洛普(Gallup),想當初蓋洛普還沒起家的時候,美國做大選民調的老大哥是讀者文摘(The Literary Digest),從1916年開始20年間從未失手。1936年正值大選之年,大蕭條期間民不聊生,讀者文摘鉚足了勁發放了1000萬的調查問卷後,預測共和黨的候選人Alfred Landon將會取得壓倒性的勝利,戰勝在任的羅斯福總統。剛起步的蓋洛普則只發放了區區5萬份調查就預測羅斯福總統將會完勝。結果當然是羅斯福總統大勝連任成功,蓋洛普上位,讀者文摘從此退出歷史舞台。

問題出在讀者文摘那1000萬的樣本。他們發放的對象是大蕭條期間還訂得起報紙,養得起汽車和電話的相對富裕的人羣,而回復調查的又通常是有強烈政治傾向的,這樣的調查遠不如蓋洛普更為隨機選擇的5萬人無偏小樣本調查來得準確。

以1936年的大選為界,抽樣統計學進入了一個新紀元,方法越來越複雜先進,誤差也被認為限制在很小的範圍內。結果風水輪流轉,80年後的2016年又是一個大選年,這次大多數的民調顯示希拉里將會以90%以上的比率絕對壓倒性的戰勝政壇新人Trump,結果大家都知道了,令民調大跌眼鏡的事情發生了,民調的預測在80年後再一次錯的離譜。為什麼呢?其實還是一樣的道理,忽視了偏遠地區人民的樣本是有偏差的,而且很多人不願或不敢表達真實的意見,使得蒐集上來的樣本只是海市蜃樓罷了。

回到咱們説的失業率的調查上來。通常這些抽樣很多是要當面訪談的,但是疫情期間一切從簡就都電話解決了。電話中得到的信息更容易出現錯誤,同時這6萬個家庭只有67%的回覆率,大大低於平時83%左右的回覆率。疫情期間居家令下,那些不接電話的家庭是忙着居家辦公呢,還是經濟太過艱難已經斷了電話線呢?這些困難都無疑加大了通過小樣本進行估計的誤差。

至於統計局特別説明裏提到的數據分類誤差,指的是統計局把在勞動市場上又目前暫時沒有工作的人歸成了兩類:一類是被暫時解僱了,這些人算是失業人口;另一類人被暫時離職了但並沒有被解僱,這些人還算是就業人口。疫情帶來的經濟突然停擺讓很多人是否能夠回到原來的工作非常模糊。比如回家待業的廚師和幼兒園老師,他們應該是算失業呢還是應該算暫時離職呢?CNBC報道,超過80%的失業人口認為自己可以回到原來的工作。

統計局在3月的報告裏發現被歸為暫時離職的人員飆升,從而發現有可能是電話訪問的人員錯誤的分類了調查對象,很多失業人口被誤認為暫時離職。4月的調查人員被嚴格訓練,但還是有大量人口被認為是錯誤歸類的。5月份統計局對調查人員的訓練更為嚴格,很多此前的錯誤應該被糾正了,也就是大量此前被劃為暫時離職的人員重新被歸為失業,這也是為什麼很多經濟學家認為5月失業人口將會飆升的一個重要原因。

統計局認為錯誤減少了,但依然存在。至於有多少人被錯誤分類了,統計局應該是用了某一種算法調整出了一個誤差百分比,比如誤差統計局説5月份的分類誤差通過小樣本的放大效應,大概影響到100萬人的歸類。所以我們説4月份美國失業率的14.7%,其實還有5%的分類誤差也就是真實的失業率可能是19.7%。而5月份美國13.3%的失業率,加上3%的分類誤差是16.3%。如果比較不算誤差的14.7%和13.3%,美國的失業率下降了1.4%,如果比較計算了誤差的19.7%和16.3%,美國的失業率下降了3.4%。所以克魯格曼在研究之後也承認美國就業市場確實是得到改善了的。當然即便如此,目前仍然每7個美國勞動人口就有一個失業,這250萬新增就業的改進在此前巨大的失業人口面前仍然只是杯水車薪。

那克魯格曼這個諾獎級別的經濟學家怎麼可能預測的這麼離譜呢?除了此前提到的很多人認為對錯誤歸類的糾偏會增加大量失業人口外,還要説到經濟學家是怎麼預測的了。

預測是依賴很多的先導指標和模型假設,而這些可能這次都是錯的。比如一個重要的先導指標是首次申請失業的人數。JP Morgan的首席全球戰略經濟學家David Kelly博士就指出,此前被廣泛報道的美國有4000萬人申請失業,可同期美國領取工資的人數下降才2400萬,失業人口上升2550萬。這説明首次申請失業人數目前是一個非常不準確的先導指標,因為很多並不符合條件的人也在政府相對寬鬆豐厚的失業救助下申請失業救助,所以相當一部分申請並沒有被批准,而且還有很多人多次重複申請。另外經濟學家廣泛使用預測企業自然消亡和創業的模型(Birth-Death Model)在疫情之下完全失效。給予錯誤的假設和錯誤的模型,無論用多高級的計算機顯然都不可能準確預測。

其實追究這個失業率裏的分類誤差還是丟了西瓜撿芝麻,更大的問題可能其實根本不在分類誤差上。失業率是失業人口除以總的就業市場上的勞動力人口。而有些人根本不會出現在這個公式裏,這就是那些不在就業市場上的人了。這個貌似簡單明瞭,不在就業市場不就是小孩和老人麼。實際上除了未成年的孩子和退休的老人,還有16歲以上的學生軍人和犯人,不想工作的和放棄找工作的人。

前幾類都還好,這個放棄找工作的人一直飽受爭議,因為很多人有可能是勞動年齡又想找工作的,但因為長時間找不到工作喪失了信心而放棄了努力。歷屆政府都想把失業率算的好看一點,所以在1994年克林頓政府時期,就決定這部分失望的就業者(long-term discouraged workers)從此不再被記入勞動力市場了。這些人或許想工作卻因為不再積極找工作而不被算作就業市場的人,從而不算在失業人口裏面。

還有些人只是短期內找不到工作,或者實在找不到全職的工作而不得不打些零工,這些人被稱為短期失望的就業者(short-term discouraged workers)和準待業工人(marginally attached workers),只要是沒有在最近4周內尋找工作也不計入勞動力市場計算失業率,成為陰影下的失業人口。比如在3月美國勞動力市場人數下降了160萬,4月下降了640萬,這巨大的變動顯然不能用退休人口來解釋。

美國有一個網站叫Shadow Government Statistics, 專門計算如果把這些陰影下的失業人口算進來,美國的失業率到底是多少。從他們的統計可以看到,如果算上這些陰影下的失業,美國目前的失業率是在35%左右。當然這種計算也是有問題的,比如的確有人是自願不工作,也有越來越多的人選擇自由職業或非全職的生活方式,所以這種計算很可能高估了失業率,但我們可以把統計局的數字看成是美國失業率的下限,把這個陰影下的失業數字看成是失業率的上限,真實的失業率應該在兩者之間。

還有一個數字可以和陰影下的失業率相印證來看,那就是就業人口參與率(Civilian labor force participation rate)。2008年金融危機前美國有近66%的處於勞動年齡的人口是就業的,2008年危機後大量人口長期遊離於勞動力市場之外沒有回來。陰影下的失業率居高不下的同時是就業人口參與率的下滑,這裏面有着非常複雜的社會問題,包括美國製造業的流失和美國版的鴉片戰爭。近些年短期和長期遊離於勞動力市場的人口都漸漸開始減少,很多人終於走出2008年金融危機的陰影慢慢找到了全職的工作,所以美國的勞動力參與率近幾年來也開始緩慢上升,相對應的是各種族的失業率在2020年初紛紛下降到近1969年以來的最低點。結果疫情襲來,一棒子被打回瞭解放前,這裏面引發的問題就是美國當前很多社會矛盾的底色了。

我們必須要説的是,雖然有這麼多的問題,美國的經濟統計數字仍然還是全世界最公開透明的也可能是最準確的,比如雖然很多人並不瞭解,媒體也少有關注,但至少這些失望的就業者人數還是被統計和公佈的。

還必須要説到就是,咱們今天只是用失業率作為一個解剖的小麻雀而已,事實上經濟統計數字裏的問題遠不止於此。比如用來度量通脹的消費者物價指數CPI是怎麼構建的,怎麼採集的,又怎麼改變的就有數量眾多的陷阱。再比如號稱華爾街上最重要的數字的倫敦同業拆借利率LIBOR,聯動着全球上萬億美元的資產價格卻居然在長達近20年的時間內是被操縱的,而且在醜聞曝光後全世界説好了要換掉它的近10年後卻仍然尾大不掉,美聯儲近來都不得不表態讓步繼續使用LIBOR。

金融是價值和信用驅動的,判斷價值和信用是需要快速準確的信息和數據的,快速準確的信息和數據的是需要快速準確的經濟指標的,所以這些經濟指標的構建和底層邏輯影響的是整個金融市場,對這些經濟指標的任何手腳也會模糊和改變市場。這些指標背後是金錢和利益,所以我們要儘量理解這些經濟指標背後那些有關於人的邏輯。不論你是金融市場上的前浪還是後浪,觀察市場的人要常常唱起小虎隊的歌:把這許多的數據串一串兒,切成片兒,剁成餡兒,再撒上些胡椒麪,辣椒麪,鹹鹽面……

祝大家一切安好,感謝關注公眾號“白話金融危機史”,咱們下回書再接着聊。

本文系觀察者網獨家稿件,文章內容純屬作者個人觀點,不代表平台觀點,未經授權,不得轉載,否則將追究法律責任。關注觀察者網微信guanchacn,每日閲讀趣味文章。