晴時多雲

菜市場政治學》林佳龍為何慘敗?以網路社群討論進行內容分析的觀察

究竟,林佳龍為何會大敗呢?從網路留言內容分析及觀察發現,大多民眾在討論這件事情時提出了以下主要歸因:空氣汙染問題、公投導致投票率下降、小英政府拖累、MOU事件、交通問題、花博因素、派系問題以及老人家健保政策,另外柯文哲因素、姚文智參選拖累、韓國瑜的韓流帶動、甚至歸咎吳音寧的也有。但究竟是哪一些因素最常被網友在這些文章中提及呢?!

 林佳龍為何慘敗?圖為:台中花博國際宣傳大使PIKO太郎(右),8日由台中市長林佳龍(左)陪同參訪花博后里森林園區。(資料照)林佳龍為何慘敗?圖為:台中花博國際宣傳大使PIKO太郎(右),8日由台中市長林佳龍(左)陪同參訪花博后里森林園區。(資料照)

◎林啟耀 /源大數據經理、政治大學政治系博士

在剛剛結束的2018九合一縣市長選舉中,民進黨遭逢大敗,蔡英文總統為此辭退黨主席一職以示負責。作為2020總統選舉的前哨戰,民進黨在最具指標性的六都選舉中,勉強保住桃園與台南,痛失高雄市與台中市。如果說高雄是因為韓國瑜突如其來帶來的韓流讓民進黨措手不及,那林佳龍市長在台中大輸盧秀燕21萬票就是更讓大家始料未及。也因此,從開票當天晚上開始,網路社群上開始各種討論為何林佳龍會在這次選舉大敗。相關文章可參考PTT文1PTT文2PTT3

圖1: 鄉民熱烈討論林佳龍大敗的原因。資料來源: 批踢踢實業坊(PTT)。(編按:「的」應為「得」。不要罵小編多管閒事…)圖1: 鄉民熱烈討論林佳龍大敗的原因。資料來源: 批踢踢實業坊(PTT)。(編按:「的」應為「得」。不要罵小編多管閒事…)

究竟,林佳龍為何會大敗呢?在學術上,最常見的研究方法可能是進行選後電訪,訪問台中選民本次投票給盧秀燕的原因或者認為林佳龍大敗的原因。不過,電訪的限制在於如果沒有提供選項給受訪者,受訪者說的答案可能太複雜難以歸類;如果提供了選項,受訪者可能就只能從預設的選項中選一。如果目前已經有很多民眾在網路社群中表達了他們對林佳龍大敗的看法,而這些看法又屬於集眾人智慧的一種形式的話,那我們只要能夠有一個合適的方法分析這些文章與留言,或許就能知道大家怎麼看這件事情。 在學術上,最合適的方法就是內容分析法。1內容分析法是一種針對文本內容做客觀、系統、量化敘述分析的一種研究方法。舉例來說,我們常會說報紙媒體有政黨色彩,那我們是如何判斷的呢?其中一個方法就是針對報紙的報導進行內容分析,得到報導內容整體而言是否偏向某個陣營得出來的結果。因此,我們也可以用此方法分析社群媒體的文章與留言,找出大家怎麼討論林佳龍大敗這件事情。

研究方法簡述

作者利用關鍵詞搭配布連邏輯(Boolean logic)的方法2,從FB粉絲團與國內熱門論壇蒐集討論林佳龍為何會慘敗相關的文章與留言,蒐集時間點則是11/24選舉日到11/26晚上23:59。在排除掉不相關的文章後,再一次利用關鍵詞搭配布連邏輯建構維度,也就是大家在討論林佳龍大敗這件事情時提到哪些可能因素,進而針對所蒐集到的文章與留言執行自動編碼。在完成編碼後,再把編碼結果以敘述統計的方式來呈現。上述資料蒐集、整理與分析結果是筆者利用任職公司所開發的uMiner全媒體數劇監測探勘平台一併完成,作者特此感謝公司提供相關資源。

分析結果

利用上述所提方法,我們在第一階段總共蒐集到2萬5千多筆文本,其中包括270篇文章以及在這270篇文章底下共2萬5千則留言左右。在這270篇文章中,有104篇文章來自FB,另外166篇則是來自國內論壇,其中有160篇來自PTT;在留言的部分,FB佔1萬7000多筆,而論壇則是8000多筆。

我們從留言內容可以發現,大多民眾在討論這件事情時提出了以下主要歸因:空氣汙染問題、公投導致投票率下降、小英政府拖累、MOU事件、交通問題、花博因素、派系問題以及老人家健保政策,另外柯文哲因素、姚文智參選拖累、韓國瑜的韓流帶動、甚至歸咎吳音寧的也有。在2萬5千筆文本中,約有3900多筆被歸類為上述的因素。另外沒被歸類的文本,其內容則可能與歸因無關。

究竟是哪一些因素最常被網友在這些文章中提及呢?圖2顯示,最多人在討論中提及了空汙相關的因素(25.9%),再來則是中央執政問題(18.7%)、交通問題(13.2%)、地方派系 (9.9%)。其他縣市選情的外溢因素,包括柯文哲因素、姚文智因素、韓國瑜因素的百分比都介於5%~2%左右。為了讓大家能理解這邊的空汙、中央執政、交通、地方派系以及毫無關係的文本是指網友的討論提及了甚麼,作者在表1針對各種因素做舉例。

圖2: 11月24日-26日期間網友如何討論林佳龍大敗 (資料來源:源大數據uMiner平台)圖2: 11月24日-26日期間網友如何討論林佳龍大敗 (資料來源:源大數據uMiner平台)

菜市場政治學》林佳龍為何慘敗?以網路社群討論進行內容分析的觀察

我們也知道,網路論壇使用者與FB使用者的價值觀、個人背景有所不同,因此他們在討論上是否會著重在不同的因素呢?圖3顯示,這兩群使用者所提到的因素確實有顯著的不一樣(X2=625.87, p-value<0.001)。FB使用者的確比較多提及了空汙、中央執政與交通的因素,相對的,論壇使用者著墨最多的是派系因素,再來才是空汙與交通因素。值得一提的是,老人健保因素在論壇討論文中被提及的比例也遠高於FB討論。這或許也是另一種同溫層效應?

圖3: 不同社群媒體網友如何討論林佳龍大敗 (資料來源:源大數據uMiner平台)圖3: 不同社群媒體網友如何討論林佳龍大敗 (資料來源:源大數據uMiner平台)

當然,以社群討論內容來分析地方選舉最有可能收到的挑戰可能是上述的討論都是鍵盤討論,並不一定是當地人的心聲。那,我們有沒有辦法採集當地人的看法呢?用IP判斷的話,誤判的可能性還是很大,FB提供戶籍地又能被擷取的又不多。因此,作者在這裡用一個比較強的假定,即:台中相關地方討論區(例如: PTT的TaichungBun,FB的我是台中人,Dcard的朝陽科技與逢甲大學板)的討論多少能代表台中人的心聲,畢竟他們比較關心台中相關事務才會較常在這些社群打混,也可能傾聽過更多台中人的聲音。在這假定能成立的前提下,那我們就能比較台中網友的聲音與其他網友的聲音。圖4顯示,在360筆左右資料中,提到交通相關因素的文本反而是比例最高的,佔31%。空汙和中央因素分別佔24.6%與11.4%,是第二與第三高。由此可見,有滿多常混台中相關板塊或討論區的網友對於台中的交通問題是挺有想法的。

圖4: 台中相關板塊或社群網友如何討論林佳龍大敗 (資料來源:源大數據uMiner平台)圖4: 台中相關板塊或社群網友如何討論林佳龍大敗 (資料來源:源大數據uMiner平台)

在進入結語之前,我們或許該先釐清一個問題,就是用機器編碼方式所產生出來的結果究竟可不可靠呢?或者也可以說,這樣的分析結果能不能接受檢驗?當然可以啊。為了檢驗分類成空汙、中央、交通、派系等等因素會不會有歸類錯誤的問題,作者以中央執政因素為例,隨機抽取100則被歸類為中央執政相關的文本,以及100則被歸類為與中央執政無關的文本,然後採用人工判斷的方式,檢查機器編碼的結果是否如研究者所設定的編碼原則。這200則文本可能會有以下四種檢驗結果:

菜市場政治學》林佳龍為何慘敗?以網路社群討論進行內容分析的觀察

左上及右下分別為判斷正確的類別,右上和左下則是錯誤歸類的類別。被抽取的200則文本歸類的結果:被歸類為中央執政因素的文本中,正確歸類(左上)的比例是90/100(90%);被歸類為非中央執政因素的文本中,正確歸類(右下)的比例是97/100(97%)。右上的錯誤情形大多是網友嘲諷林佳龍可以到中央當官,而不是真的歸咎於中央導致大敗;左下的錯誤則是因為網友認為責任在蔡總統、賴院長或陳菊秘書長時稱呼他們的方法不在筆者的預設範圍。其他的歸因也可以用相同方式進行驗證。

結語

本文以內容分析法來分析網路論壇以及社群媒體上的內容,發現大多人在討論林佳龍之所以會大敗,空汙、中央執政拖累與交通問題是較常被提及的因素如果進一步區分媒體來源,論壇使用者提出派系可能是很重要的一個因子。如果假定台中相關板塊或粉絲頁比較能符合台中人的心聲的話,交通因素反而是被提及頻率最高的。透過上述分析結果,本文或許不是直接回答林佳龍為何大敗,但是至少也反映出了不同網路社群使用者認為林佳龍大敗的原因是甚麼。

隨著越來越多人在網路社群對於公共議題發表意見,這些意見的集合毫無疑問能夠提供我們相當具有價值的資訊。相較於傳統民意調查,蒐集網路社群意見結合內容分析法的優勢在於資料更多(有時候可能稱不上大數據,但也至少不是1068而已)、速度更快(至少比電訪快很多,會在選後結束那麼久才寫出這篇文是作者的問題)、更不會被受訪者知道(如果是電訪,或許你會顧忌麥當勞歡樂送)。也要注意的是,這個分析方法的分析單位是文本,與傳統民意調查以人為單位的分析效度理所當然不同。所以我們在以這個方法進行推論時,必須更謹慎小心。


註釋:

1.Bernard Berelson. 1952. Content analysis in communication research. New York: The Free Press. 

2.舉例來說,林佳龍 and 敗選 就是文章中同時出現林佳龍和敗選這兩個詞時,這篇文章就會被蒐集。 

本文經授權轉載自菜市場政治學 林佳龍為何慘敗?以網路社群討論進行內容分析的觀察 

不用抽 不用搶 現在用APP看新聞 保證天天中獎  點我下載APP  按我看活動辦法

相關新聞

編輯精選

載入中