這個心理統計現象叫趨中迴歸(Regression Toward the Mean), 188x 年由達爾文的表兄弟 Galdon 發現,197x 年由 Tversky & Kahneman 給出心理學的完整解釋。
Galdon 發現高個子父代(比如標準化後正一個標準差的父代),後代高度的分佈中心(簡單理解就是均值),比父代低。後來學界進一步發現更一般的規律。一羣正一個標準差的子代,其父代的高度均值也小於一個標準差;如果學過相關係數就都明白這也是事實:更更一般的規律,用正相關係數來預測,正一個標準差的 X 得到的 Y 預測值總是小於正一個標準差。
Tversky & Kahneman 的文獻指出一個常識,然而不如説它是常識的盲點:人類認知會本能地作相關係數為 1 的錯誤預測,身高正一標準差的父代,孩子的身高會被錯誤的本能預測為正一標準差;你今天開心的程度是正一標準差,就會本能地預測另一天還應該這麼開心,然而相鄰兩天開心程度的相關合理的猜測只有 0.7 或者更低,無論你向前預測還是向後預測,正確的預測是平均 0.7 個標準差,本能的預測會錯誤地高估這 0.3 個標準差。
藉助 Rubin 基於反事實定義的因果概念,此時觀察者會觀察到 0.7(事實)和反事實假設的 1(本能的錯覺)存在差異,於是會推論存在一個外部的原因導致 1 變成了 0.7。這個推論過程雖對,但兩個前提一對一錯。
小結一下:Galdon 告訴你會看到 0.7,Tversky & Kahneman 告訴你本能會錯誤地去想 1,Rubin 告訴你只要你看到的和相信應該看到的東西不同,就會找一個原因來解釋這個差異。
https://en.m.wikipedia.org/wiki/Regression_toward_the_mean