一鍵研究全市場所有股票,多因子模型有何神奇之處?
一、從主觀到量化
傳統的股票基本面研究,採用的是分析師閲讀公司財報,進行市場調研,在公司進行實地調研,以及邀請行業專家訪談等方式。這樣的研究方法耗時費力,而且一次研究僅針對一家或者數家相關的公司。在A股上市公司超過4000家的今天,已經不可能有任何投資者可以憑藉這樣的方法覆蓋全部的上市公司了,甚至對於一個數十人配合有序的投研團隊來説,想要覆蓋全部的上市公司也是幾乎不可能完成的任務。
與股票的主觀研究不同,量化研究採用統一的數量化的方法對所有滿足特定條件的股票進行研究。在計算機的幫助下,量化研究可以大大提升投研效率,避免研究者的情緒影響。由於量化研究採用的是統一的研究框架,所以不同股票的研究結果之間可比性強。從數量化的角度用統一的模型解釋股票的收益率一直是量化投研中的重要問題。
二、從單因子到多因子
最早的對收益率的解釋是資本資產定價模型(Capital Asset Pricing Model)。該模型假設了市場是有效的,即股價已經公允地反映了所有公開信息,並且迅速調整到位。每個市場參與者都是理性的。在該模型中預期收益率可以分解為無風險收益率和風險收益率(即風險溢價,對風險的補償)兩部分。該模型認為所有超越無風險收益率的回報都可以用額外承擔的風險來解釋。同時它也給出了對於股票所承擔的市場風險大小的度量。
然而事實上市場並非有效。歷史上許多重大事件中股票市場的表現都告訴我們,股價對信息的反應常常是不足的或者過度的,而且常常會經過比較長的時間。並非所有投資者都是理性的,投資者對同樣的信息可能有截然不同的判斷。與此同時還有一些投資者在依據無效的噪聲信息進行交易。
正因為如此,資本資產定價模型對現實中股票市場的解釋能力並不強。人們發現了很多股票存在着無法用市場收益率解釋的超額收益率。Fama-French三因子模型是資本資產定價模型之後另一個非常著名的模型,該模型認為股票的收益率可以用市場因子、市值因子和賬面市值比因子共同解釋。該模型比較好地解釋了小市值公司和高賬面市值比(即低市淨率)公司有高於市場的收益率的現象。這實際上是最早的多因子模型。
後續研究中,人們找到了許多對於股票收益率有解釋能力而且具有相當普遍性也容量量化的特徵,這些指標的來源非常多樣,包括公司所在的行業、公司的財務和經營狀況、股票的交易狀況、以及分析師對公司未來的預期等。人們對這些特徵做了精確的定義並做必要的數學處理之後,就得到了因子。
由於股票市場非常複雜,任何單一的因子都無法對股票的收益率做出好的解釋,所以人們常常從不同角度構建多種類型的因子,用各個因子收益率的組合來解釋股票的收益率。在構建的過程中,一般還會要求選出的因子要有足夠強的解釋力,與其他因子的關聯要儘可能小,同時因子的構成最好比較簡單,有比較明確的實際意義,可解釋性好。Fama-French三因子模型可以説是最早的比較成功的嘗試。
三、多因子模型的典範:barra因子
A股市場上一個常用的因子體系是barra因子。barra因子可以分為三組,分別是國家因子、行業因子和風格因子。其中國家因子和行業因子的暴露比較簡單,取值只有1和0,屬於該國家和該行業的,對應的國家因子和行業因子的暴露取為1,否則取為0。風格因子從流動性、質量、價值、成長、情緒、動量、市值、波動率、股息率九個一級因子來解釋股票的收益率。每個一級因子又由若干個二級因子組成,有些還有更細分的三級因子。Barra風格因子通過良好的定義和恰當的數學處理,既對股票收益率有很強的解釋力,同時彼此之間的相關性很低,各個因子也都有比較明確的意義,是一種常用的股票和投資組合的風格分析方法。下面我們對這個常用模型中的風格因子暴露做進一步説明。
3.1 風格因子——流動性
流動性反映股票交易的活躍程度,一般用換手率衡量,只有一個二級因子。barra採用了不同頻率的換手率來構建流動性因子。
二級因子 | 相關指標 |
流動性 | 月換手率 |
季換手率 | |
年換手率 | |
指數平均年化換手率 |
3.2 風格因子——質量
質量衡量的是公司財務狀況的好壞。衡量財務狀況的角度非常多,barra選取了槓桿、盈利穩定性、盈利質量、盈利能力、投資質量這五個二級因子合成為質量因子。
槓桿是公司負債情況的反映。高槓杆的公司在經營狀況良好時可以快速擴張,但是在經營狀況不佳時虧損甚至破產的風險也更大。
盈利穩定性用各類盈利指標的標準差來度量,一般來説盈利穩定的公司更受投資者青睞。
盈利質量反映的是企業當前的經濟現狀和未來的經濟前景,主要由企業資產和負債狀況描述。
盈利能力指的是企業獲取利潤的能力。
投資質量用企業總資產、股本和資本支出的增長來反映。
二級因子 | 相關指標 |
槓桿 | 股票總市值 |
優先股賬面價值 | |
長期負債賬面價值 | |
總負債 | |
總資產 | |
所有者權益 | |
盈利穩定性 | 過去5年營業收入標準差 |
過去5年歸母淨利潤標準差 | |
過去5年經營淨現金流入標準差 | |
未來12個月每股收益預測標準差 | |
盈利質量 | 貨幣資金 |
流動資產 | |
應收賬款 | |
應付賬款 | |
短期負債 | |
存貨 | |
折舊攤銷 | |
總資產 | |
盈利能力 | 營業收入 |
營業成本 | |
歸母淨利潤 | |
總資產 | |
投資質量 | 總資產5年增長率 |
總股本5年增長率 | |
資本支出5年增長率 |
3.3 風格因子——價值
價值衡量的是股票估值的高低程度,主要用總市值與一些重要財務指標相比來衡量。包含賬面市值比、盈利能力和長期反轉三個二級因子。
賬面市值比即淨資產除以總市值,也就是市淨率的倒數。
盈利能力考量了企業的利潤、現金流以及未來的盈利潛力。
長期反轉表示股價過去較長時間內的漲幅,計算中的時長取1040個交易日。衡量標準是長期相對無風險收益的強度和長期相對全市場的強度。
二級因子 | 相關指標 |
賬面市值比 | 總市值 |
淨資產 | |
盈利能力 | 息税前利潤 |
歸母淨利潤 | |
每股收益 | |
折舊與攤銷 | |
總市值 | |
長期反轉 | 過去1040個交易日漲幅 |
3.4 風格因子——成長
成長衡量企業盈利和營收的歷史增長情況,計算中採用過去5年的數據,只有一個二級因子。
二級因子 | 相關指標 |
成長性 | 過去5年每股收益 |
過去5年營業收入 | |
分析師預期長期(3年)淨利潤增長率 |
3.5 風格因子——動量
動量表示的是過去一段時間股價的漲幅。包括短期反轉、季節、行業動量和相對動量四個二級因子。
短期反轉衡量短期(計算中取最近一個月)的股價變化。
季節衡量歷史同期收益率。
行業動量衡量股票相對其所在行業的強度。
相對動量衡量股票相對全市場的強度。
二級因子 | 相關指標 |
短期反轉 | 最近一個月對數日收益率 |
季節 | 過去5年次月收益率 |
行業動量 | 個股相對強度 |
行業相對強度 | |
相對動量 | 過去一年對數收益率 |
歷史alpha |
3.6 風格因子——市值
市值衡量股票相對於全市場其他股票的市值,由規模和中市值兩個二級因子組成。
規模用流通市值的自然對數表示。
中市值用規模因子的三次方對規模因子正交化取得。
二級因子 | 相關指標 |
規模 | 流通市值 |
中市值 | 規模因子 |
3.7 風格因子——波動率
波動率衡量股價的波動情況,由貝塔和殘差波動率兩個二級因子組成。
貝塔是過去一年收益率對滬深300指數的迴歸係數。
殘差波動由貝塔的殘差波動率,收益率日標準差和累積對數收益率的最值共同決定。
二級因子 | 相關指標 |
貝塔 | 過去一年收益率序列 |
過去一年滬深300指數收益率序列 | |
殘差波動 | 迴歸殘差波動 |
日度年化收益率 | |
累計對數收益率範圍 |
3.8 風格因子——情緒
情緒衡量分析師對股票的關注度和未來的預期情況。由調整比率、預測EP變化,預測每股收益變化三個二級因子組成。
調整比率衡量分析師的預期調增與調減次數。
預測EP變化衡量分析師對股票EP預測的變化。
預測每股收益變化衡量分析師對股票每股收益預測的變化。
二級因子 | 相關指標 |
調整比率 | 分析師預期調增次數 |
分析師預期調減次數 | |
預測EP變化 | 分析師預測EP |
預測每股收益變化 | 分析師預測每股收益 |
3.9 風格因子——股息率
股息率衡量股票過去和未來預期的派息情況。由歷史股息率和分析師預期股息率兩個二級因子組成。
歷史股息率為過去12個月每股股息除以股價。
分析師預期股息率為分析師預測的未來12個月派息除以股價。
二級因子 | 相關指標 |
歷史股息率 | 過去1年股息 |
股價 | |
分析師預期股息率 | 分析師預測未來12個月派息 |
股價 |
四、barra因子收益
在得到國家因子、行業因子和風格因子的暴露之後,我們可以來計算各個因子的收益。對於因子收益,最理想的定義是找到一些股票的組合(每隻股票的佔比都可正可負),使得組合在該因子上的暴露為1,同時在其他所有因子上的暴露為0。但是考慮到前述對因子暴露的定義,滿足這樣條件的持倉不一定存在,我們需要做出適當的調整。
與此同時組合還需要有足夠的分散度,使得個股的特異性收益對最終結果的貢獻可以忽略。
4.1 因子收益——純國家因子
純國家因子的組合就是市場組合,即按流通市值的權重持有所有股票。該組合在各個行業上的暴露不為0,取決於該行業的市值。通過恰當的數學處理,可以使得該組合在所有風格因子上的暴露為0。
因子類別 | 因子暴露 |
國家因子 | 1 |
行業因子 | 有正有負 |
風格因子 | 0 |
4.2 因子收益——純行業因子
純行業因子的組合是在本行業暴露為1,同時在國家因子暴露為0的組合。因為所有股票在國家因子的暴露都是1,所以該組合多頭市值和空頭市值相等,並且在其他所有行業因子上的暴露均為負。通過恰當的數學處理,可以使得該組合在所有風格因子上的暴露為0。
因子類別 | 因子暴露 |
國家因子 | 0 |
本行業因子 | 1 |
其他行業因子 | 負 |
風格因子 | 0 |
4.3 因子收益——純風格因子
純風格因子的組合應該嚴格滿足前述條件,在國家因子,所有行業因子和所有其他風格因子上的暴露均為0,在自身風格上的暴露為1。因為所有股票在國家因子的暴露都是1,所以該組合多頭市值和空頭市值相等,僅依靠暴露這一個風格來獲取收益。
因子類別 | 因子暴露 |
國家因子 | 0 |
行業因子 | 0 |
本風格因子 | 1 |
其他風格因子 | 0 |
4.4 用因子收益指導投資
上面討論的純因子組合大多非常難以實現,但是這不影響其在理論分析中的指導意義。我們可以計算這些純因子組合的模擬收益率作為因子收益率,對投資形成指導。
例如,我們可以研究各個因子收益率的時序特點,從中找出有穩定收益的因子,有收益但是不穩定的因子,沒有收益只有波動的因子等,從而對選股提供有意義的指導。
此外,由於A股市場已經有了超過4000家上市公司。要研究全體股票的相關性,數學上要求價格時間序列的長度不能低於上市公司數量,這在實際中是無法實現的。因子暴露和因子收益率提供了一種非常方便的研究股票相關性的工具,它將我們的分析基礎由4000多隻股票簡化為了數十個因子。解決了相關性分析中的共線性問題,同時也使得結論的可解釋性更強。
barra因子是研究行業配置、收益歸因,風險暴露等問題的重要工具。“工欲善其事,必先利其器”,要做好量化研究,對於像barra因子這樣基礎工具的熟練掌握是必由之路。
本文源自金融界