2004年1月6日 星期二

民意調查的兩個迷思

民意調查的兩個迷思

作者◎蘇建州

2004.01.06 中國時報

愈接近總統大選,各個機構所做的民意調查此起彼落,數字也各有不同。預計在選前陸續還會有上百個民調發表。你相信那家機構或那一次的民調結果?我們又可以依據什麼標準來判斷民調的可信度?

回溯在過去幾次選舉中,民調的整體表現可以說是「慘不忍睹」,然而「民意調查產業」卻仍在經濟不景氣中蓬勃發展。即使很多人質疑這些經由黑箱作業所產製的數字的品質,但也別無選擇的大篇幅報導與討論這些數字。民意調查到底是不是一種科學方法?為什麼民調預測與選舉結果間的誤差經常會遠超出所宣稱的「在百分之九十五的信心水準下的二至三個百分點的抽樣誤差」?相信這是許多民調新聞消費者共同的疑惑。

一九三六年美國文學文摘(Literary Digest)進行了一次規模空前的選舉民調,他們根據電話號碼簿與汽車註冊資料共郵寄了一千多萬份的問卷,其中回收兩百多萬份問卷結果是Landon 五十五%, Roosevelt 四十一%;而同時間蓋洛普民調使用較科學的抽樣方法,只根據一千多個樣本資料估計 Landon 四十四%, Roosevelt 五十六%。選舉結果Roosevelt以六十一%得票率當選總統。而文學文摘在兩年後停刊,蓋洛普民調則因此建立其專業調查的聲譽,至今仍不墜。

上述事件是民調發展史上很重要的里程碑,根據蓋洛普在一九三七年所進行的選後民調發現:固然家中沒有電話或汽車的選民較傾向支持Roosevelt,他們沒有機會受訪是造成民調偏差的重要原因外(稱為涵蓋率誤差),而那些收到問卷卻沒有寄回所造成的「未回應誤差」才是影響民調準確度的主因。

反觀在台灣媒體民調中好像很少關心「未回應誤差」對民調準確度的殺傷力,筆者認為,我們實應以文學文摘的慘痛經驗為殷鑑。事實上,完美的電話民調應該是成功聯繫與訪問「所有」在過濾非住宅電話、空號、傳真機等無效號碼後的「原始樣本」,不能有任何替代樣本。

不幸的是根據筆者的瞭解,大多數的民調都只成功訪問約三十五%的原始樣本(其中約有二十五%拒訪,二十五%不在家,十五%未表態),然而這些影響民調品質甚鉅的數字卻不會出現在民調報告中。

筆者也發現最近的某些民調為了彌補「遺漏」原始樣本對民調準確度的影響,紛紛使用各種加權變數,諸如性別、年齡、省籍、教育程度、戶籍等來調整樣本結構與民調結果。然而如同蓋洛普選後民調所顯示:同樣是家中有電話或汽車的選民,願意回應與不願意回應的受訪者的政治態度傾向有很大的差異。我們實在沒有理由認為那些晚上在家且願意接受訪問的年輕人和晚上不在家,或拒訪的年輕人會有相同結構的政治態度傾向。

筆者認為「大樣本數」與「濫用加權估計」是國內選舉民調的兩個迷思。最近許多民調機構競相擴大樣本規模,從一○六八增加為一○○○○個(抽樣誤差從三個百分點減少為一個百分點),試圖增加民調的可信度,殊不知未回應誤差的「殺傷力」可能會高達二十個百分點。雖然加權估計確實改善樣本結構,但過份迷信加權估計的效果也可能適得其反。

事實上,給民調工作者的忠告是:最好的方法也就是最笨的方法,老老實實的電話重撥追蹤,重質不重量的儘可能訪問大部分的原始樣本。筆者希望有一天能看到一則民調報告所強調的是使用科學抽樣方法,原始樣本有很高的聯繫率與合作率。那就對了!

(作者為世新大學傳播管理系副教授)