砸下數百萬美元分析CEO語氣，投資者用AI發現比財報更多的細節

2021-10-25由舒培榮釋出於財經

夢晨發自凹非寺

量子位報道 | 公眾號 QbitAI

上市公司的CEO一言一行都得謹慎，不然股價分分鐘跌給你看。

回想這輪缺芯潮剛剛開始的時候，IT行業高管們還在發言中迴避或淡化供應鏈問題。

幾個月後，大眾、福特這些老牌車企也遭波及，紛紛出聲警告“我撐不住啦，我要減產”。

一輪股市動盪隨之而來。

不過卻有那麼幾家投資機構一點也不慌，因為他們早就捕捉到了CEO們信誓旦旦言論背後的遲疑。

他們用AI演算法對比CEO發言稿中選擇的字詞和說話時的語氣，分析出了高度不一致性。

使用演算法的基金經理表示AI技術能幫他們在競爭中取得優勢。

畢竟頂級投資機構都把財務報表分析的透透的了，很難從中榨取出更多價值。

此外，演算法還產生了一個有趣的副作用。

因為即興發言太容易暴露心理狀態，逼得越來越多的CEO提前寫好照稿唸了。

誰在用？

走在前面的有英國曼氏集團旗下的基金MAN AHL。

從1983年開始，這隻基金就靠一個叫AHL Diversified的演算法策略自動跟蹤市場變化，到現在已經成了“量化投資界的航母”。

隨著機器學習方法的發展，MAN AHL也不斷把新技術應用到投資策略中。

對於CEO的發言，他們的演算法關注語調、節奏和重音，再結合NLP技術與文字轉錄版本作對比，找出口頭和字面表述不一致的部分。

具體演算法細節雖然不公開，不過也可以從MAN AHL的機器學習主管Slavi Marinov偶爾發表的論文中略作了解。

在證券市場使用NLP技術的還有日本野村證券。

他們統計了2014年以來公司高管在電話會議上語言的複雜程度和股價的關係，結果是使用簡單措辭的公司股價要比複雜措辭的高出6%。

美國銀行（Bank of America）也利用電話會議中出現的詞彙來預測公司債券違約率。

他們的模型驗證了削減成本（Cost Cutting）、燒錢（Cash Burn）這樣的詞與公司未來違約行為高度相關。

這樣的AI系統，開發和執行成本高達數百萬美元，一般小公司還真用不起。

大的投資機構到底能不能用這個賺到錢？他們以商業敏感性為由都沒有透露。

對於小的投資機構，市場上也有一批技術提供商可以出售分析服務，也就是此前火過一陣的概念FinTech（金融科技）。

用的什麼模型？

金融NLP最大的問題就是資料量不夠，把能找到的新聞和電話會議記錄全用上也不夠訓練出效果好的語言模型。

不過得益於預訓練技術的發展，先用大量通用領域文字訓練，再用少量金融新聞和經過標註的電話會議文稿微調取得了效果。

很多金融語言模型都是基於BERT，像倫敦證券交易所推出了使用路透社新聞訓練的BERT-RNA和使用39萬份電話會議記錄訓練的BERT-TRAN。

ICRL 2020也收錄了一篇金融語言模型論文FineBERT。

一家投資機構Sparkline Capital透露了很多他們的BERT模型訓練細節。

預訓練分為用通用文字、未標註的電話會議記錄、帶情緒標註的IMDb電影評論三步，最後再用少量帶情緒標註的電話會議記錄微調。

最後，Sparkline Capital還解釋了為什麼現階段不能直接用深度學習來預測股價。

因為相比CV和NLP任務的資料來說，金融市場上參與者眾多、交易行為產生的資料信噪比太低。

噪音稀釋了資料中的有效資訊，AI模型會更容易被隨機性騙到。

按他們的說法，一張貓照片包含的資訊量比1000個企業價值倍數（EV/EBITDA）資料還多。

參考連結：

[1]https://www.reuters.com/technology/ai-can-see-through-you-ceos-language-under-machine-microscope-2021-10-20/

[2]https://www.nature.com/articles/s41598-021-82338-6

[3]https://www.linkedin.com/pulse/deep-learning-investing-opportunity-unstructured-data-kai-wu/

[4]https://www.lseg.com/about-lseg/labs/financial-language-modelling

[5]https://arxiv.org/abs/2006.08097