精準預測讀後感





大學在統計系時修了一堂課,叫巨量分析,整學期只要唸一本書,就是這本Nate Silver的精準預測,記得當時僅念完了須報告的一個章節,應付了事;直到畢業多年後又有機會重拾書本,才再度打開這本又厚又重的書再給他一次機會,可能是工作過的關係,許多細節變得有共鳴許多,搭配「真確」做閱讀可以得到最好的效果,讓人更清楚這世界的規則,以及對「不確定」這個既可怕又隨處可見的觀念有更多的包容。

開書就開宗明義地用2008年次級房貸風暴的例子告訴你,預測失誤的結果,不會是一笑置之的小事;預測一種新商品,從來沒有人有經驗的東西,比方說抵押債務債券(CDOs),從來就不是簡單的事,除了無前例可循之外,別忘了標準普爾這種評等機構也是營利導向,為了賺錢,他們很樂意為新商品背書,即便自家的分析師對商品根本不甚了解,卻可以做出斬釘截鐵的一致好評;再來Nate又拿了電視上的名嘴對選舉的預測做舉例,即便有些人天生好嘴,說得口沫橫飛,但這種特別會講的人,或喜歡把話說死的人,拿他預測的結果去回測,會發現正確率比投擲銅板(0.5)的機率還差。

我喜歡書中提到Berkley政治學教授泰特洛克提到對於預測的比喻,也就是說到預測會有兩種人,一種是「刺蝟」,說話斬釘截鐵、毫不退讓而且希望以一個簡單的規則囊括所有情況;相對於刺蝟,另一種人則是「狐狸」,對於不同領域學者的看法採開放態度,對自己的預測保留不確定性、自我評判預測內容,小心謹慎且對複雜之狀況採取包容態度,大多數的名嘴都是刺蝟,畢竟斬釘截鐵的話聽起來比較像是權威會說的話,也比較像是節目效果,但如果今天你要預測投資走向或是知道自己病情發展,比起刺蝟,你會比較希望做出預測的人士個狐狸。

本書中段則是以地震、經濟預測作為例子,告訴我們雜訊的存在,為何是以地震以及經濟作為例子呢,因為這兩者都是複雜的系統,而預測這兩者的科學家對於訊號的判讀都因人而異,有時候偶然做出正確的預測,也可能只是雜訊隨機的一個表現;不同的是地震的資料太少,而且人命關天、又牽涉政治問題,比較難突破「可預測」這件事;相較於地震,經濟的資料就多了,但大多數的經濟學家做出的預測都不是很好,因為項先前提到的,經濟是一個相對複雜的系統,很難判斷單一事件是訊號還是雜訊,也有另一個原因–預測錯了不會死人,不會像預測錯堤防高度造成嚴重後果(比如說淹死一個城鎮的人),自然沒有人會為自己做出的差勁預測負責。

再來常見的錯誤還有模型錯誤,Nate提出傳染疾病中常用的SIR模型,將群體分成易受感染、已受感染以及已經康復(或死亡),但這模型忽略了人的行為模式各不相同,在疫情肆虐的2020更是有感觸,有的國家封城只是封個意思的,有的國家就能徹底落實防疫,而單以SIR模型來預測疾病傳染模式就忽略的這些點,就如同George Box在統計學上有名的那句話所說的,所有的模型都是錯的,但某些模型很有用一樣,貓最好的模型就是貓,但有時候為了可行性,模型有所取捨之時,就是考驗預測者的實力之時。

而全書我最喜歡的一個部分就是Nate提到的貝氏思想,貝氏機率的精隨在於,如何在給定的新事件發生的機率(條件機率)後,調整你對本來事件發生的機率(先驗機率),得到更新後的事後機率,這代表你在發現了一項新的證據之後,必須改變你的說詞,所以說會因應新證據而調整說法的預測者,才是好的預測者。

最後作者以恐怖攻擊的例子來提醒我們,雖然整個20世紀只發生一件911事件(機率極低),但一旦發生,他的死傷人數比整世紀其他小規模恐攻相加都還來的多,我認為並不是要預測者杞人憂天,而是要因應預測的主題不同,有不同的心態去面對,總之這本好書確實值得不斷複習,以及不斷去檢視自己無論在工作中抑或是生活中,有沒有不小心變成刺蝟而不自知,這是一件必須謹記在心的事,也以此書給在做資料處理的我一個警惕。

沒有留言:

張貼留言

季寧談管理讀後感

承蒙研究所恩師曾宗琳老師贈書,尤其在企管所唸了兩年之後,拜讀季寧的管理哲學,別有一番風味。公司管理究竟是可以用教科書教學而使管理人才有機會量產的一門學科,還是師父領進門,悟道與否自在徒弟有否慧根的一門藝術,自古便爭論不休。印象最深刻的,便是研究所參加台大 TMBA ...