數字會說話,但這些民調數字到底說了什麼話?當我們搜集了大量的問卷調查,這個統計資料該如何被解讀呢?其實,資料解讀與詮釋的簡單原則就是把樣本特性說明清楚,不然就像瞎子摸象。就算不知道分析的對象是誰, 也要說明清楚調查目的與可能的限制,再來談資料詮釋才有意義。因此,要解讀資料,我們可以先從資料長什麼樣子來觀察。

資料長什麼樣子?

要描繪資料的樣貌,我們可以從中心點在哪以及分布狀況如何,這兩個層面來回答。
為了方便讓讀者了解,這裡我們用「數感實驗室(Numeracy Lab)」在 2017 年初所做的「孝敬父母的紅包大調查」,以受訪者的年收入與年紀來討論「給父母的紅包金額」的有趣分析當例子。討論之前,我們必須先提醒讀者,「民 意調查是怎麼做的?」對於統計分析結果的正確性影響很 大,譬如誰是「紅包大調查」受訪者?由於這個調查是直接發布在臉書的粉絲頁,主動填寫問卷的人除了本身就具有數感實驗室的「粉絲」特徵(可能是喜歡數學的人、 重視小孩教育的父母、喜歡數感小編的寫作風格等)之 外,可能還具有某些特質,比如說也許是覺得自己包的比較多或是收入比較高的人傾向願意填寫,造成最後的結果 可能會有略為高估的情形。簡單來說,這些自願送上門 來的受訪者或是在路上隨意發問卷來的受訪者,都屬於非 隨機抽樣,因為不知道他們與我們實際感興趣的那個群體所有人(母體)的差異,因此只能針對被調查的這群人進行描述性的說明,而不能進行推論。這個資料庫大家不會 太認真討論正確性,但是可當作一個例子讓大家了解如何解讀資料。

中心點在哪?

「紅包大調查」由於是網路自填問卷,主動填答的受訪者 只能代表他們自己,而由資料中我們可以知道有效的 259 個受訪者的性別、年齡、家庭收入和雙親紅包總和,並針 對這些受訪者來討論紅包金額平均多少?是否大家都差不多、還是有些人特別多或特別少?這時候,「平均數」就 是一個很方便檢視資料樣態的工具。
平均數大家都相當的熟悉,是所有觀察值的總和除以個案 數,也可以被視為一組資料的中心點。如紅包區間圖所示, 我們可以很快速的知道這 259 個受訪者包給父母的紅包平 均金額為 17000 元,大多數集中在 0~2 萬元之間。另一個 與中心點相關的概念是中位數,也就是將所有受訪者依紅 包金額高低排序後,最中間那一位的金額,在這筆資料中 第 130 位受訪者的金額是 12000 元。由平均值與中位數的 相對位置來看,可以發現平均值較易受到極端值,也就是 最高金額 12 萬的影響,導致大部分受訪者所包的紅包金額 低於平均值。這例子也顯示雖然由平均數來看中心點相當便利,卻不見得每一次都是最適合的工具。政府單位公布 的薪資調查資料也有相似的情形,公布的平均薪資與民眾 感受有相當大的落差,而相對較低的中位數反而更貼近民 眾所感受到的薪資水平,這反映了我國薪資的整體分布實 際上是往低薪的一端傾斜,在這種情況下以中位數來看薪 資會比平均數更有意義。

資料的分布狀況?

在知道資料的中心點後,另一個要問的是:資料的分布 呈現什麼樣子?若用於民眾態度的調查,就是民意是集 中的還是分散的呢?這個問題可以交給標準差(standard deviation)來回答。標準差是指資料中各點與中心點的「標 準距離」,以定義來說,是各點與中心點的距離(相減後的差)平方後累加起來取平均數,再開根號還原。標準差反映的是資料中各點之間的離散程度,當資料越集中,各點與中心點的距離越近,標準差越小,反之,資料越分散, 各點與中心點的距離越遠,標準差就越大。
在檢視資料時,了解離散程度非常重要,原因在於:擁有 同樣中心點的兩筆資料,可能有完全不同的分布情形。當民調資料只看平均數而不管離散程度時,很容易做出錯誤的解讀。以縣市首長的施政滿意度調查為例,若各請 100 位受訪者以 0~100 來表示對縣市首長的施政滿意程度, 假設 A、B 兩縣縣長的滿意度平均數皆為75.06,但A縣是大多數受訪者的滿意度集中在75 上下,則標準差小(2.936),而B縣受訪者的滿意度分散於50~100 之間,則標準差大(9.608)。兩縣接受調查的民眾看似都對縣長施政傾向滿意,但由離散程度來看,B縣必須特別注意極 端意見的民眾,避免在某些情況下出現高強度的反彈,造成施政的困難。
圖一:數感實驗室「孝敬父母紅包大調查」。(作者提供)


樣本與母體長的不一樣怎麼辦?我們要怎麼推論?

只要不是普查,抽取出來的樣本一定會與你感興趣的母體之間有落差。因此,在解讀時必須特別注意「抽樣誤差」的存在。若是非機率抽樣,我們不清楚這些人的特性與母體之間的落差,因此僅能就有回答的這些人做結果的說明 與闡述,不能推論到所有的人。若是再進一步推論,所做出來的詮釋一點根據也沒有,萬萬不可相信。
我們經常在媒體上看到很嚇人的民調數字,比如說:「一 例一休後,3成上班族薪資縮水一成!」。這些數字怎麼來的?真的可以這樣子推估嗎?以104人力銀行的資訊科技針對求職會員進行「一例一休影響」問卷調查為例,這些求職會員通常具有某種同質性,也許是對於現在的薪資不滿想轉換跑道,也許是剛開始找工作的新鮮人,有著各種的可能性,總之並非隨機抽樣,這些同質性可能造成調查結果的偏誤。因此調查結果「已有30%上班族因公司管 控加班、少賺加班費,導致實質薪水變少,平均減少幅度11.3%」,只能說明這群受訪者的情形,並不適合用來推估所有臺灣的上班族。
即便是隨機抽樣,僅用少數抽取到的樣本觀察值來推估母體被稱為「點估計」,是不可能精準的。就像是在校門口隨意抽取50個學生量完身高算出平均(樣本平均數)後, 就想要命中這間學校全體學生的平均身高(母體平均數), 是幾乎不可能的事。
想用調查結果來推估母體,就必須使用「區間估計」。區間估計是指在計算出樣本與母體的落差後,考量抽樣誤差的範圍(也就是我們在民調數據表格下常見的誤差 ±3%), 在我們可容忍的準確範圍之內(如95%信心水準),做出 可靠的估計。抽樣誤差是樣本調查結果與真實母體之間的差距,代表一種區間,也就是樣本估計的結果被包含在一定的上下限內。95% 的信心水準指的是,雖然只抽樣一次,但我們相信有 95% 的機會,真實的母體平均數會落在得到的樣本區間裡。換個角度來說,就是容許5%失誤的機會。以選舉民調常見的「在 95% 的信心水準下,抽樣誤差約為正負3個百分點,訪問1000名受訪者得到 A候選人支持度為48%」為例,由調查結果來看,A候選人的支持度應落在45%~51%之間。

圖二: A、B 縣長施政滿意度,透過平均數、中位數與標準差,我們就可以大概知道資料的樣態與分布的情形。(作者提供)

最後,我們用一個最近實際發生的例子來結尾。美國選舉預測的龍頭 Five-irtyEight,在2016年美國總統大選前最後預測民主黨希拉蕊 48.5%(與實際得票率一樣),共和黨川普44.9%(與實際得票率 46.4% 差 1.5%),二者誤差都非常小,可說是非常準確。但由於媒體與民眾在看民調 結果時往往忽略誤差的存在,覺得選前預測應該完全命中選舉結果(點估計),或至少方向一致,導致選後掀起一陣民調大失準的檢討聲浪。以這個例子來說,比起檢討民調準確性,更應該反思,是否多數媒體與民眾具備正確看待民調數據的眼光。
民調可以告訴我們很多事,但必須說明調查的範圍與誤差,有多少資料說多少話,不過度推論、詮釋與解讀。掌握這些 原則後再去談資料結果,呈現出來的比例分布、趨勢與變項間的關係(如家庭收入與紅包金額的關係)才有意義。而學會怎麼聰明的看這些數字,才不會被有心操弄的人左右。

圖三: FiveThirtyEight 網站 2016 年美國總統大選前最後預測。(https://projects.fivethirtyeight.com/2016-election-forecast/

作者簡介

林珮婷/政治大學選舉研究中心博士後研究員,政治大學政治學博士。主要研究領域為民 意調查、性別政治、選舉與投票行為。 賴以威/國立師範大學電機系助理教授。
林珮婷/政治大學選舉研究中心博士後研究員,政治大學政治學博士。主要研究領域為民意調查、性別政治、選舉與投票行為。
賴以威/國立師範大學電機系助理教授。

【本文已獲作者同意轉載】