◎廖育嶒/美國休士頓大學政治學系博士候選人
民主政治最大的特色,就是政府首長及民意代表由人民以平等、公正的選舉產生,也由於選舉結果往往難以預測,因此民意調查成為預測選情的途徑及工具。民調有許多的方式,由早期傳統的市話民調,到現在的網路時代,愈來愈多媒體使用即時網路民調,而市話民調也遇到愈來愈高比例「純手機族」的挑戰,讓學界開始重視手機民調的應用。然而,無論是什麼樣的民調方式,最重要的是看民調方法是否有進行抽樣。
為什麼要抽樣?
首先要來談民調的核心概念:抽樣。為什麼抽樣那麼重要?這是因為我們希望調查結果具有代表性。因為我們不可能訪問到所有人,民調就是希望透過一小群「有代表性」的樣本來推論「母體」(通常是全臺灣或者某一個特定範圍內,例如全縣、全市民眾的意見或是投票意向)。
抽樣的核心精神在於,讓每一個樣本(受訪者)被抽中的機率一樣。如果沒有抽樣,將造成偏差的推論。一項經典的案例是發生在1936年美國《文學文摘》(Literary Digest)的調查,其用200萬名讀者的樣本,預測共和黨總統候選人Alf Landon將獲得壓倒性的勝利,但實際結果卻是由民主黨候選人Franklin Roosevelt獲得勝利。這是因為《文學文摘》的讀者組成偏向高社會經濟地位,而那些非讀者們、社經地位較低的群眾,完全沒有被抽中當成樣本的機率,也因此調查結果缺乏代表性。
接下來本文先討論最不準確的網路民調,再討論市話民調,以及手機民調各有何優缺點。
網路民調
網路民調,顧名思義就是民眾可以透過網路平台直接點選問題的選項來回答。即使網路有即時性及低成本的特性,但是準確度卻有很大的問題。這是因為網路民調有高度的「選樣偏誤」(selection bias),使得調查結果的推論被扭曲。因為網路民調沒有透過抽樣來決定受訪者,也因此網路民調的樣本往往具有年輕及高學歷的傾向,會高估年輕及高學歷族群的意見。此外,民眾是自己選擇(self-select)參與網路民調,這類民眾往往樂於在網路平台表達自己的意見,並且對政治議題較為關心。因此,網路民調的另一項偏差就是高估對政治有高度興趣民眾的意見。
許多媒體喜歡用網路即時民調來調查網友的意見。我們充其量只能說這是針對網路媒體「讀者群」的調查,而不能說結果能代表臺灣民眾的意見。由於多數民眾有特定的媒體偏好,也選擇收看特定黨派顏色的媒體,也因此我們可以發現不同政治色彩的媒體會呈現非常不一樣的民調結果。這些網路調查真的就是僅供參考而已,因為他們的樣本沒有代表性(舉例來說,在泛藍媒體上面看到90%支持泛藍候選人,或者泛綠媒體上面看到90%支持泛綠候選人的民調結果,都是可以預期的事)。
圖為政論節目〈政經看民視〉於2018年九月份所發佈的台北市長選舉網路民調。
然而,並非說網路民調就沒有優點。由於網路民調有低成本及即時性的特性,如果你的受訪樣本是經過抽樣而來,或者你有一套完整的調查清單且有他們的電子郵件聯絡方式,那就會是一個很方便且便宜的民調方式。舉例來說,筆者曾協助教授進行全臺灣社區大學的調查,我手上有一份「調查清單」,那麼網路民調就能作為一項「工具」去進行調查。或是,網路民調可以蒐集受訪者對於調查問題的回饋,來對正式電話訪問、面訪的問卷問題進行修正。由於網路民調是相當方便的工具,學界也運用平時透過電話訪問、面訪來蒐集願意提供電子郵件的受訪者清單,透過抽樣這些受訪者,以達到「接近」代表性的結果。政大選研中心、台灣選舉與民主化(TEDS)調查計劃、中山大學政治所等學術單位就有類似的網路民調抽樣實驗室,透過先前的電話調查所建立的調查資料庫,這樣的網路民調在60歲以下年齡層甚至可以達到跟電訪的全國代表性很相近(當然還是無法完全取代);部份的媒體也有類似的運用。
市話民調與手機民調
接下來我們討論市話與手機民調。市話民調是現在最普遍,也是目前臺灣各政黨用來做民調的方式。一般學術界在做市話訪問時,會採用「成套樣本」進行訪問,也就是假設每1000筆電話(或其他固定數字)為一套樣本,這是第一階段的隨機抽樣。以全國性民調為例,這個成套樣本是透過登錄在電話簿的號碼,並依造縣市人口比例分層抽樣而來的樣本。舉例來說,臺北市占總全國人口比例的11.3%,那麼臺北市的電話在1000筆當中就會有113筆。也因為市話有「區碼」,所以才能夠做到分層抽樣。以學術界的標準來說,電話訪問先使用第1套樣本,如果用完第一套樣本後仍未完成目標設定的訪問數(如統計理論上經常採用的抽樣誤差不大於3%的1068份有效樣本),才使用第2套樣本,依此類推。訪問完成時,該套樣本如果沒有打完所有的電話,依學術界的標準應打完該套樣本,這是為了要維持所有縣市的接觸比例。例如假設最後剩下的電話多數是台中市或桃園市的電話,這兩個市的接觸比例就偏低了。
由於市話樣本能依據人口分布分配電話比例,讓每一縣市的電話有同樣的受訪機率,也避免僅有少數縣市的民眾被接觸到。但是手機號碼只有門號,沒有區碼,也因此純手機的調查訪問將使得各縣市受訪民眾的比例分配,有可能會不符合實際縣市人口的比例,或是偏重都會區人口的比例。由於我們用小樣本透過「加權」來推估母體,也因此純手機民調可能導致部分縣市被接觸的比例過低,再經加權後將造成的誤差相當大。
戶中抽樣
再來,我們要討論的議題是「戶中抽樣」,這也是市話民調第二個階段的隨機抽樣。學術界進行的市話民調一定會進行戶中抽樣,但是多數民調公司可能忽略這個步驟,因為會多增加許多時間跟電話費的成本。一般來說,多數民調電話接觸到受訪者,確認滿20歲具有選舉投票權(或18歲具有公民投票權),就直接開始訪問。然而,家裡總是有坐在話機旁的椅子上固定接電話的人,可能是爸爸可能是媽媽。如果民調總是問爸爸或媽媽,年輕人跟老年人受訪比例就會降低。學術界有一套公式表格,我們會問受訪者家中有多少滿20歲具有選舉投票權的成年人,這些成年人當中有多少位男性(或女性),然後再從這些人來進行抽樣,請他們聽電話,而不是直接去問接起電話的人。戶中抽樣可能會抽中家中最年長的男性、最年輕的女性,或是第二年長的男性等,有不同的隨機排列組合。這是為了讓不同年齡層跟性別的民眾都有相等的機率被抽中受訪。
然而,家裡總是有坐在話機旁的椅子上固定接電話的人,可能是爸爸可能是媽媽。如果民調總是問爸爸或媽媽,年輕人跟老年人受訪比例就會降低。(示意圖/資料照)
除了投票意向之外,不同年齡層的民眾對於同婚議題、死刑存廢、核能議題等重大政策也都有不一樣的意見。戶中抽樣可以確保家中的人被抽到的機率是一樣的,而不是只抽中最常去接電話的那個人。因此,如果一般民調公司都有做到戶中抽樣,基本上市話民調的準確度還是最高。
涵蓋率
另一項議題是關於「母體涵蓋率」,也就是指「使用某項工具的人口比例」,例如家戶市話比例、手機持有比例。根據洪永泰教授指出,以個人(不是家戶)為計算單位,住宅電話的涵蓋率大概是在65%至75%之間,手機涵蓋率則為85%至95%之間。幾乎人人都有一支手機。換句話說,大約有25%至35%的民眾是只用手機而不用住宅電話的「唯手機族」(cell phone only),5%至15%是只用住宅電話不用手機。由於並非人人都會將市話登錄在中華電信的電話簿上,為了彌補涵蓋率,市話調查會在前文所述抽樣而得的成套樣本,在市話末二碼或末四碼隨機由電腦產生其他號碼組合,以接觸其他未在電話簿登載市話號碼的民眾。
純手機族都是那些人?
唯手機族有幾項特徵,年輕族群,租屋族,多數不在戶籍地居住,工作性質跟階層非常多元,還有高度網路使用者。以電子治理中心2018年8月的調查顯示,手機調查完訪樣本中,沒有上網者僅6%,市話調查則是18.2%;其中,60歲以上者不上網比例為26%,但市話調查則高達54.6%,顯示手機調查訪問到比較多的網路使用者族群。純手機調查的選樣偏誤主要是高估「網路族群」的意見。網路族群比起一般民眾更容易接受訪問,他們勇於對許多議題表達意見,還有顯著較低的「無反應(拒答、不知道、沒意見)」比例。
唯手機族有幾項特徵,年輕族群,租屋族,多數不在戶籍地居住,工作性質跟階層非常多元,還有高度網路使用者。(美聯社)
傳統市話民調的缺點是無法接觸到「唯手機族」,特別是學生及租屋族,他們是市話無法涵蓋到的一群人。根據2017年臺北市政府研考會的調查顯示「人住在臺北市但戶籍不在者」只用手機而不用住宅電話者高達70.9%。2018年的調查結果顯示,臺北市的純手機族高達34.1%,也就是超過三分之一的臺北市選民是純手機族而沒有家用電話,這的確會對傳統市話訪問造成挑戰。
純手機調查的偏差
儘管手機的涵蓋率較高、持有手機的人比持有市話的人多,但是「純手機族」的比例也相對較高,因此純手機的民調也有較高的偏差 。不少研究的案例也指出,純手機調查跟市話調查呈現相當不一樣的結果。首先以「電子治理中心2016年調查」為例,1對於「相同性別可以結婚」表示贊成者,手機調查是49.8%、市話電話調查是35.1%;反對者手機調查是37.3%、市話調查是49.8%;同一個研究中的網路調查數據更為極端,贊成者高達64.1%、反對者僅有25.8%。以2018年同婚公投結果來做事後驗證,市話電話調查的推估比純手機調查及純網路調查的推估更準確。再以「2016年一月總統選舉預測研究」為例,2在投票意向方面,純手機族也有較高支持宋楚瑜的比例,這與選舉結果相比,手機調查明確出現高估宋楚瑜支持度近7個百分點。(編按:近日已有一些單位開始釋出以手機調查為主的民調,例如:台灣制憲基金會就有手機族和市話的調查比較,非常有趣。同時大家應該也可以發現,智庫單位委託民調公司做的民調,通常會和主流媒體上的民調結果差距顯著)
儘管如此,這不代表手機調查不應該被重視。以2014年桃園市長選舉跟新北市長選舉為例,鄭文燦選前民調從來沒贏過吳志揚,最後卻是逆轉小贏3萬餘票,而聲勢遙遙領先的朱立倫在新北市僅以兩萬餘票的差距(1.3%)險勝對手游錫堃,沒有贏到原先預估的二十萬票。這突顯了傳統市話民調低估年輕族群的聲音,也可能跟一般民調公司做市話民調沒有做戶中抽樣有關。
結論
就這三種最常見的調查方式,網路民調的準確度是最低,最不具有樣本代表性的調查方式。根據洪永泰教授等人的結論,市話民調的準確度還是較高。但以現在純手機族比例趨高的趨勢,以市話和手機進行雙底冊(dual frame)進行調查是較好的方式,即以市話調查為主,手機調查為輔,不僅可以增加樣本涵蓋率,還可以降低調查成本。以目前純手機族比例來看,市話民調佔70%,手機民調佔30%左右應該是最佳組合方式。在未來這個組合比例將可能因為純手機族比例的提高進而調整。
1. 曾憲立、洪永泰、朱斌妤、黃東益、謝翠娟。2018。〈多元民意調查方法的比較研究〉。《調查研究—方法與應用》,41: 87-117。
2. 張鐙文、黃東益、洪永泰。2017。〈住宅電話與手機雙底冊調查的組合估計:以 2016總統選舉預測為例〉。《選舉研究》,24(2): 65-96。
本文經授權轉載自菜市場政治學 反映真實民意:網路、市話與手機民調的差異