7.18.2020

聯合報名人堂:<數字的真相與假象>

廿年前剛開始職場生涯時,部門主管送給我一本書,叫做「如何用統計學說謊」。這本書是達瑞爾.霍夫在一九五四年寫的,主要在闡述運用統計經常出現的錯誤。因為它淺顯易懂,一度還成為美國大學統計學入門教科書,現在仍持續再版,並有多種語文翻譯。


送這本書除了開玩笑外,當然也有提醒意味,不管是無心之過還是刻意誤導,用數字說故事,有時反而讓真相被淹沒,對於從事資料分析工作的人,這類事情非常需要避免。


然而,在疫情蔓延當下,統計數字卻不時扮演弔詭角色。


最典型錯誤,是樣本來源造成誤差,像病毒剛開始由中國大陸傳到境外,歐美媒體曾經出現「年輕人感染率不知為何偏高」疑惑,其實單純是因韓國新天地教會群聚感染,不少信眾是大學生年紀緣故。另外也有獨立變數高度相關,讓溯源變得困難,比如東亞社會病毒擴散率遠低於世界其他地區,到底是牛痘疫苗、天生基因、生活習慣、珍珠奶茶,還是多用口罩帶來的結果呢?還記得咖哩可以防疫傳說嗎?


當然有心人刻意利用數字影響大眾,例子就更多。美國現在最大爭議之一,在於學校是否應該如期開學,川普政府認為年輕人染疫致死比例極低,開放效益遠高於風險,所以強烈推動重開。最近社群媒體出現一則貼文,「教育部長說兒童肺炎死亡率僅有○.○二%」「你知道嗎?那會是一萬四千個小孩」。問題是,其實她並沒有說過這個數字。


美國政府在經濟與防疫兩者間捉襟見肘,川普與支持者淡化疫情影響,甚至認為減少檢測就會減少確診,如此心態的確直接造成疫情持續擴散,可是相反方向誤導也不在少數。新冠肺炎全球蔓延後,從更多樣本導出致死率比原先猜測低很多,美國疾病管制局曾經將估計下修至○.二六%,是季節性流感兩倍多。儘管仍有專家對此初步數據表示懷疑,認為○.五%左右才是正確的,然而大眾恐懼早超出相對比例。在「只是尋常感冒」跟「像SARS一樣恐怖」間,媒體跟政客一如往常用本身利益決定訊息方向,於是疫情嚴重性,同時被高估與低估。


民主黨維吉尼亞州政府浮報檢測數、共和黨佛羅里達州政府檢測無症狀遊民降低確診比例、川普政府在死亡高峰出現前宣揚醫療成果,各種統計名目令人眼花撩亂地出現,不知道數字是在說故事還是在說謊。科技進步讓互動圖表變得清晰易懂,大數據分析讓趨勢從此難以遁形,可是,真相真的因此清晰了嗎?


對了,前面說到達瑞爾.霍夫,儘管寫了一本諄諄教誨的暢銷工具書,可是那本書出版不到十年,他就從菸草公司拿錢著手撰寫續集,想用數字駁斥香菸對人類健康有害的「謬論」。


說真的,不管在哪一個時代,每個人都只能自己小心謹慎,別被統計學騙了。

沒有留言:

【彩虹】:Kacey Musgraves 2019

  【彩虹】收錄在Kacey Musgraves 2019發行的專輯,因為歌名的關係,很受到LGBTQ團體的歡迎,不過也因為如此,雖然是首鄉村歌曲,卻被不少保守的鄉村廣播電台視為禁歌。 她寫這首歌,本來也沒有特別的訴求,只是有一天看星座預測,上面跟獅子座的她說,「雖然事情看來很糟...