實時預測中國GDP增速

本篇是系統化資產配置系列報告的第六篇,詳細介紹了一種實時預測中國GDP增速的Nowcasting方法。

實時預測是識別當前經濟狀態的流行方法。它的思想就是利用所有可得的資訊來獲得當前經濟狀態的估計。舉例來說,GDP增速是反映經濟狀態的最直接指標,但由於它只在每季度釋出一次,且釋出時間滯後,因此我們總是無法得到當前季度的GDP增速。這樣一來,我們就必須使用其他更高頻指標如工業增加值增速等來推測當前季度的GDP增速。

宏觀經濟資料建模面臨多個難點,包括資料公佈時間不同步、有缺失值、截面維度高和資料頻率不一致等。為了解決這些問題,本文介紹了一種基於動態因子模型的Nowcasting方法。在這個模型裡,所有可觀測的宏觀經濟資料能夠被若干不可觀測的隱含因子所解釋。

我們從工業、價格、國內外貿易、固定投資、財政、景氣調查、銀行與貨幣等方面選取了39個指標建立了中國經濟Nowcasting模型。我們在模型中設定了5個隱含因子,分別是全域性因子,實際產出因子,金融因子,情緒因子和價格因子。

本文還利用動態因子模型進行了實際測算。透過在樣本內構建“偽資料集”的方法,我們展示了對於2019年二、三、四季度GDP同比的Nowcasting過程。結果發現,隨著資料集的擴大,對當季GDP的預測值與實際釋出值會越來越接近,這初步驗證了基於動態因子模型的Nowcasting方法有效性。

最後,基於2020年4月13日的可得資料,我們對2020年一季度GDP同比做了樣本外預測,最終預測值為-2.849%。2020年4月17日國家統計局正式公佈了我國2020年一季度GDP同比增速為-6.8%。

本篇是系統化資產配置系列報告的第六篇,詳細介紹了一種實時預測中國GDP增速的Nowcasting方法。實時預測是識別當前經濟狀態的流行方法。它的思想就是利用所有可得的資訊來獲得當前經濟狀態的估計。但是,對宏觀經濟資料建模面臨多個難點,包括資料公佈時間不同步、有缺失值、截面維度高和資料頻率不一致等。為了解決這些問題,本文將介紹一種基於動態因子模型的Nowcasting方法,並利用此方法對我國2019年二、三、四季度季度做模擬預測,結果發現預測準確度較高。最後,基於2020年4月13日的可得資料,我們對2020年一季度GDP同比做了樣本外預測,最終預測值為-2.849%。

風險提示:本報告結論基於歷史資料,在市場環境轉變時模型存在失效的風險。

報告正文

1 Nowcasting

1.1. 什麼是Nowcasting

對於政府機構來說,當前經濟狀態直接影響到宏觀政策的制定。例如,央行需要判斷當前經濟是否過熱,從而決定是否需要透過加息等措施來給經濟降溫。對於投資者來說,經濟狀態也直接影響投資策略。例如在經濟上行時,投資者應該配置更多的權益資產。因此準確且及時的識別當前經濟環境具有重要的意義。

實時預測是識別當前經濟狀態的流行方法。它的思想就是利用所有可得的資訊來獲得當前經濟狀態的估計。舉例來說,GDP增速是反映經濟狀態的最直接指標,但由於它只在每季度釋出一次,且釋出時間滯後,因此我們總是無法得到當前季度的GDP增速。這樣一來,我們就必須使用其他更高頻指標如工業增加值增速等來推測當前季度的GDP增速。

那麼如何對數量龐大的各種宏觀指標建模,從而實現實時的經濟狀態預測呢? 本文將介紹一種基於動態因子模型的Nowcasting方法,它可以解決宏觀經濟資料建模面臨的多種困難。

1.2. 宏觀經濟資料建模的難點

宏觀經濟資料的特點決定了我們難以用簡單模型如線性迴歸來對其建模和預測,宏觀資料建模的難點主要有以下幾點:

1. 宏觀資料公佈時間不同步,且可能有缺失值。一般來說,各類宏觀資料是隨著時間推進而逐漸釋出的。PMI這種調查資料可以在當月底獲得;工業、價格等資料在次月上旬釋出;而M2、社融等資料要在次月中下旬才能獲得。也就是說,在任意時刻我們可得的最新宏觀資料呈現出“鋸齒狀”結構。另外,我國宏觀資料在每年春節前後有“官方缺失”的特點。根據統計報表制度,2月份不釋出1月份規模以上工業和能源生產、固定資產投資、房地產開發投資和銷售、社會消費品零售總額和工業經濟效益等資料。

2. 宏觀資料頻率不一致。為了進行宏觀資料研究,我們需要將資料統一在一個頻率上。對宏觀資料來說,月度頻率是最常見的,但如GDP增速等重要資料卻是季度釋出的。如何科學的處理這種頻率的不一致是一個問題。

3. 宏觀資料截面維度高,但時間序列長度較短。現代市場經濟執行極為複雜,各種各樣的統計指標都能在一定程度上反映經濟執行情況,如工業生產、固定資產投資、國內貿易、對外貿易、財政、銀行與貨幣、價格以及各類景氣度調查等等。而由於宏觀指標釋出頻率通常在月頻以下,經常會出現宏觀資料截面維度高於時間維度的情況,也就是有N>T的問題,這給建立計量模型帶來一定困難。另外,截面維度過高也給挑選和剔除指標帶來了困難。

4. 宏觀資料統計口徑可能發生變化。理論上說,統計口徑變動是為了讓測量值更好的逼近真實值。但統計口徑大幅變動帶來的不一致性可能會嚴重影響線性迴歸等簡單模型的預測和推論。因此我們需要某種更加穩健的方法來對宏觀資料建模。

2 動態因子模型

2.1. 標準動態因子模型

實時預測中國GDP增速

2.2. 考慮誤差項序列自相關

實時預測中國GDP增速

2.3. 模型估計算法

動態因子模型中需要估計的變數包括各個隱含因子和模型引數,它們的取值互相依賴且未知變數數量龐大,因此普通的最大似然法難以有效的估計模型。幸運的是,學界已經提出了可以穩健估計動態因子模型的PCA EM演算法。

具體來說,PCA EM演算法流程如下:

實時預測中國GDP增速

以上的PCA EM演算法將宏觀資料對映為若干個隱含因子,可以解決資料截面維度高的問題。其中的EM演算法還使用了Kalman濾波,它可以自動處理缺失值,同時對於統計口徑的變動具有較強穩健性。

2.4. Nowcasting過程

實時預測中國GDP增速

3 中國經濟Nowcasting模型

前文介紹了動態因子模型理論及其估計方法,下面我們開始正式建立中國經濟Nowcasting模型並介紹宏觀資料的具體處理方法。

3.1. 中國宏觀資料處理

實時預測中國GDP增速
實時預測中國GDP增速
實時預測中國GDP增速

3.2. 模型設定

我們從工業、價格、國內外貿易、固定投資、財政、景氣調查、銀行與貨幣等度量宏觀經濟的不同角度選取了39個指標來建立中國經濟Nowcasting模型。參考紐約聯儲Nowcasting模型的隱含因子設定,我們在中國經濟Nowcasting模型中設定了5個隱含因子,分別是全域性因子,實際產出因子,金融因子,情緒因子和價格因子。

不同的宏觀資料根據其型別對5個隱含因子的載荷不同。舉例來說,GDP同比增速對全域性因子和實際產出因子有載荷,而對金融、情緒和價格因子沒有載荷。CPI同比對全域性因子和價格因子有載荷,而對實際產出、金融和情緒因子沒有載荷。圖表1詳細給出了每個宏觀資料的型別及其對5個隱含因子的載荷設定。

實時預測中國GDP增速

4 實證結果

4.1. DFM模型結果示例

我們首先給出一個DFM模型的估計結果示例。假設當前時點為2020年4月13日,我們從Wind終端獲取從2005年1月以來的所有可得宏觀資料,然後透過PCA EM演算法估計出模型引數和5個隱含因子序列。

圖表一給出了模型估計的5個隱含因子序列,他們分別代表全域性因子、實際產出,金融,情緒和價格。我們可以看到在2008年金融危機前後各個因子水平出現了劇烈波動,且其中情緒因子變動較其他因子有明顯領先性。另外,在2020年2、3月份,由於疫情衝擊,可以看到實際產出和情緒因子出現大幅下跌。

實時預測中國GDP增速

我們之所以在模型中納入全域性因子,目的是為了捕捉所有宏觀變數的共同推動因素,從而在後續做某一宏觀指標的預測時能夠納入所有新資訊對目標指標的衝擊。另外,全域性因子捕捉了經濟執行中的共同推動因素,某種程度上可以作為經濟整體活躍水平的一種度量。圖表3給出了全域性因子與本文使用的所有標準化宏觀資料的歷史序列,直觀地看全域性因子確實能夠捕捉到變數間的總體變動趨勢。

各宏觀指標在因子上的載荷大小能在一定程度上表示其蘊含的資訊量。圖表4給出了對全域性因子載荷最大的10個宏觀指標,其中房地產價格載荷最大,這可能表明我國經濟在最近15年裡確實受房地產行業影響較大。

實時預測中國GDP增速
實時預測中國GDP增速

圖表5給出了實際產出因子與GDP同比和工業增加值同比的變動關係。從圖表看,隱含因子走勢與GDP同比和工業增加值同比走勢非常一致,這說明實際產出因子能夠捕捉到經濟體中的實際產出變動。

在以上的討論中我們發現,各隱含因子具有衡量經濟執行狀態的潛在能力。不同的隱含因子代表經濟執行的不同方面,在未來,我們會進一步探究利用隱含因子序列來對經濟週期進行劃分的可行性。不過,本文的重點是探究動態因子模型對宏觀指標的預測能力,下面我們以GDP同比的預測為例,給出Nowcasting模型的結果。

4.2. Nowcasting樣本內預測示例

如本文2.4部分所述,標準的Nowcasting過程是在每個時點獲取所有可得資料,然後據此擬合DFM模型、更新預測結果。不過由於難以獲取各宏觀指標的歷史釋出時間資料,我們在這裡透過構建歷史月度“偽資料集”的形式來展示Nowcasting過程。

舉例來說,假設我們處在2019年二季度,此時二季度GDP同比資料尚未釋出,我們要利用其他已有資料來對其進行預測。假設在某時刻2019年3月份及之前的所有資料已經發布完畢,我們便利用2005年1月至2019年3月的所有月度資料擬合DFM模型,從而獲得2019年二季度的GDP同比增速預測值。圖表6中的2019-03行就表示基於2019年3月及之前資料對二季度GDP同比增速的預測結果。可以看到,此時二季度GDP預測值為6.873%,與二季度實際釋出增速6.2%差距較大。同樣的,基於2019年4月及以前的資料,我們再次擬合DFM模型,獲得二季度GDP預測值為6.491%,預測值較上月預測有明顯下降。基於2019年5月資料的二季度GDP預測值為6.238%,較上月預測值繼續下降,且與實際值的差距明顯縮小。圖表6中最後一行假設了除二季度GDP以外的其他2019年6月資料均已釋出,基於此偽資料集的二季度GDP預測值為6.336%。從以上預測過程可以看出,隨著時間推移和資料集的擴大,對於GDP增速的預測會越來越準確,逐漸貼近實際釋出值。

使用相同的方法,我們再給出對於2019年三、四季度GDP同比增速的預測過程示例。

從圖表7看,基於2019年6月及之前資料的三季度GDP同比預測為6.697%,與6.0%的實際值差距較大。而基於2019年8月和2019年9月的資料集對三季度GDP預測分別為5.957%和5.988%,與實際值已經非常接近。

從圖表8看,基於2019年9月及之前資料的四季度GDP同比預測為6.227%。而基於2019年11月的資料集,四季度GDP預測值修正為6.045%,非常接近實際值。

總體來看,隨著資料的不斷髮布,對於當季GDP的預測值與實際釋出值會越來越接近,這初步驗證了本文基於動態因子模型的Nowcasting方法有效性。

4.3. Nowcast2020年一季度GDP同比

4.2部分的Nowcasting結果示例是基於偽資料集的樣本內預測,還不能完全展示Nowcasting實際過程和證明DFM模型的預測有效性。在撰寫本報告時,2020年一季度GDP同比資料尚未釋出,我們在此利用DFM模型對其進行樣本外預測。

我們以2020年4月6日和2020年4月13日獲取的兩組資料集來展示實際Nowcasting過程。為了更好的展示一季度GDP同比預測值的變動過程,我們首先依然利用本文4.2部分的方法構建截止2020年2月的月度歷史偽資料集,並用每個資料集擬合DFM模型從而獲得一季度GDP同比預測值序列。

從圖表9看,基於2019年12月及之前資料的一季度GDP同比預測值為6.470%。而隨著一月份資料釋出,GDP同比預測降為4.847%。同時二月份經濟資料出現較大下滑,這直接導致一季度GDP預測轉為負增長3.398%。

實時預測中國GDP增速

從圖表10看,3月份乘用車銷量、貨物週轉量以及進出口情況超出預期,公佈值均高於上次預測值,這使得模型上調了GDP對數同比預測值。因此,截止2020年4月13日我們對一季度GDP同比的最新預測值為-2.849%。

值得注意的是,本文使用的動態因子模型是一種純粹基於資料的計量模型,它的準確與否取決於資料的質量和更新的速度。另外,相比模型給出的預測絕對值,新資訊帶來的預測值邊際變化可能對於指導投資有更重要的意義。

5 結論

本文首先介紹了實時預測的概念和思想,列舉了宏觀經濟資料建模的難點。然後介紹了動態因子模型及其估計方法,動態因子模型本身的特性使其可以方便的處理中國宏觀經濟資料具有的釋出時間不一致、缺失值、截面維度高和資料頻率不一致等問題。

隨後我們從工業、價格、國內外貿易、固定投資、財政、景氣調查、銀行與貨幣等度量宏觀經濟的不同角度選取了39個指標建立了中國經濟Nowcasting模型。參考紐約聯儲Nowcasting模型的隱含因子設定,我們在中國經濟Nowcasting模型中設定了5個隱含因子,分別是全域性因子,實際產出因子,金融因子,情緒因子和價格因子。

我們還利用動態因子模型進行了實際測算。透過在樣本內構建“偽資料集”的方法,我們展示了對於2019年二、三、四季度GDP同比的Nowcasting過程。結果發現,隨著資料集的擴大,對當季GDP的預測值與實際釋出值會越來越接近,這初步驗證了本文基於動態因子模型的Nowcasting方法有效性。

最後,基於2020年4月13日的可得資料,我們對2020年一季度GDP同比做了樣本外預測,最終預測值為-2.849%。2020年4月17日國家統計局正式公佈了我國2020年一季度GDP同比增速為-6.8%。

風險提示:本報告結論基於歷史資料,在市場環境轉變時模型存在失效的風險。

往期連結

《系統化資產配置系列之一:另類風險溢價的分類以及系統化的配置方法》

《系統化資產配置系列之二:行業的重新分類及行業輪動策略》

《系統化資產配置系列之三:基於機器學習的短期擇時》

《系統化資產配置系列之四:如何對擇時系統構建統一的方法論?》

《系統化資產配置系列之五:基於擇時的目標風險和風險預算擇時模型》

證券研究報告:

《系統化資產配置系列之六:實時預測中國GDP增速》

對外發布時間:2020年04月24日

報告發布機構:興業證券股份有限公司

本報告分析師 :

於明明

SAC執業證書編號:S0190514100003

實時預測中國GDP增速

自媒體資訊披露與重要宣告

使用本研究報告的風險提示及法律宣告

興業證券股份有限公司經中國證券監督管理委員會批准,已具備證券投資諮詢業務資格。 本報告僅供興業證券股份有限公司的客戶使用,本公司不會因接收人收到本報告而視其為客戶。本報告中的資訊、意見等均僅供客戶參考,不構成所述證券買賣的出價或徵價邀請或要約。該等資訊、意見並未考慮到獲取本報告人員的具體投資目的、財務狀況以及特定需求,在任何時候均不構成對任何人的個人推薦。客戶應當對本報告中的資訊和意見進行獨立評估,並應同時考量各自的投資目的、財務狀況和特定需求,必要時就法律、商業、財務、稅收等方面諮詢專家的意見。對依據或者使用本報告所造成的一切後果,本公司及/或其關聯人員均不承擔任何法律責任。

本報告所載資料的來源被認為是可靠的,但本公司不保證其準確性或完整性,也不保證所包含的資訊和建議不會發生任何變更。本公司並不對使用本報告所包含的材料產生的任何直接或間接損失或與此相關的其他任何損失承擔任何責任。

本報告所載的資料、意見及推測僅反映本公司於釋出本報告當日的判斷,本報告所指的證券或投資標的的價格、價值及投資收入可升可跌,過往表現不應作為日後的表現依據;在不同時期,本公司可發出與本報告所載資料、意見及推測不一致的報告;本公司不保證本報告所含資訊保持在最新狀態。同時,本公司對本報告所含資訊可在不發出通知的情形下做出修改,投資者應當自行關注相應的更新或修改。

除非另行說明,本報告中所引用的關於業績的資料代表過往表現。過往的業績表現亦不應作為日後回報的預示。我們不承諾也不保證,任何所預示的回報會得以實現。分析中所做的回報預測可能是基於相應的假設。任何假設的變化可能會顯著地影響所預測的回報。

本公司的銷售人員、交易人員以及其他專業人士可能會依據不同假設和標準、採用不同的分析方法而口頭或書面發表與本報告意見及建議不一致的市場評論和/或交易觀點。本公司沒有將此意見及建議向報告所有接收者進行更新的義務。本公司的資產管理部門、自營部門以及其他投資業務部門可能獨立做出與本報告中的意見或建議不一致的投資決策。

在法律許可的情況下,興業證券股份有限公司可能會持有本報告中提及公司所發行的證券頭寸並進行交易,也可能為這些公司提供或爭取提供投資銀行業務服務。因此,投資者應當考慮到興業證券股份有限公司及/或其相關人員可能存在影響本報告觀點客觀性的潛在利益衝突。投資者請勿將本報告視為投資或其他決定的唯一信賴依據。

投資評級說明

報告中投資建議所涉及的評級分為股票評級和行業評級。評級標準為報告發布日後的12個月內公司股價相對同期相關證券市場代表性指數的漲跌幅,A股市場以上證綜指或深圳成指為基準。

行業評級:推薦-相對錶現優於同期相關證券市場代表性指數;中性-相對錶現與同期相關證券市場代表性指數持平;迴避-相對錶現弱於同期相關證券市場代表性指數。

股票評級:買入-相對同期相關證券市場代表性指數漲幅大於15%;審慎增持-相對同期相關證券市場代表性指數漲幅在5%~15%之間;中性-相對同期相關證券市場代表性指數漲幅在-5%~5%之間;減持-相對同期相關證券市場代表性指數漲幅小於-5%;無評級-由於我們無法獲取必要的資料,或者公司面臨無法預見結果的重大不確定性事件,或者其他原因,致使我們無法給出明確的投資評級。

免責宣告

本平臺旨在溝通研究資訊,交流研究經驗,不是興業證券股份有限公司研究報告的釋出平臺,所釋出觀點不代表興業證券股份有限公司觀點。任何完整的研究觀點應以興業證券股份有限公司正式釋出的報告為準。本平臺所載內容僅反映作者於發出完整報告當日或釋出本平臺內容當日的判斷,可隨時更改且不予通告。

本平臺所載內容不構成對具體證券在具體價位、具體時點、具體市場表現的判斷或投資建議,不能夠等同於指導具體投資的操作性意見。

實時預測中國GDP增速

版權宣告:本文源自 網路, 於,由 楠木軒 整理釋出,共 7471 字。

轉載請註明: 實時預測中國GDP增速 - 楠木軒