在閱讀資訊的時候,要先區分「相關性」與「因果性」的不同。
A與B具有極高度的正相關,不代表A與B之間有因果性。舉例來說,
我們發現所有死亡者在生前都喝過白開水,而喝過白開水的人最後
都會死亡。「死亡」與「喝白開水」的相關性高不高?根本就是
無一例外!但是我們能據此推論:喝白開水會導致死亡嗎?
(如果認為這個推論合理的,我求求你不要再看下去了)
所以,油價下跌,股價也下跌;油價上漲,股價也下跌。這兩個
現象是可以並存的。股價下跌的原因在於投資人看淡後市,所以
預期石油耗損量減少,有供過於求的可能,油價自然下跌。
油價上漲,理由可能很多,然而不管怎樣,總會增加經營成本,
推升通膨,增加升息的風險,所以股價自然會下跌。
這例子中,「油價」與「股價」之間的因果關係是存在的,但是
在統計學上卻是看不出相關性來。
能區別因果關係跟相關性之後,就不會落入機率論的迷思當中。
試問:連續擲了九次骰子,都出現奇數,那麼第十次的時候,再次
出現奇數的機率是多少?老實講,還是50%。因為每一次擲骰子都是
獨立事件。在尚未擲出第一次骰子時,我們宣稱:要連擲十次奇數
的機率只有 1/1024 。但是每擲出一次奇數,就會讓這個數值不斷
上升,到了第十次時,就只剩下 1/2 的機會了。
濫用統計是投資失利的好方法。就算XX月份出現上漲的機率高達100%
,下一年度的XX月份漲跌與否,還是獨立的。不然,想像一下:一支
六連發型左輪手槍,只裝入一顆子彈,大家輪著對自己腦門開槍。
結果,五個人安全過關了,現在輪到你,你覺得這五個人100%過關,
會讓你更放心嗎?
其次,因果關係在一個系統裡,往往是高度宗錯複雜的。相同的兩件事,
可能在這個狀況下,A是B的因;另外一個狀況下,B卻變成A的因;
更多時候,A既是B的因,也是果,差異的只有比重高低。但至少我們可以
抓出共變項,例如:A是C的果,B也是C的果,所以,看起來A與B之間有
因果關係,其實根本沒有。
啊,有事情要處理了。晚點再寫。
--
※ 發信站: 批踢踢實業坊(ptt.cc)
◆ From: 123.204.52.115