2024選戰溫度計
主要參選人當選預測模型分析說明
壹、預測模型說明
2024 選戰溫度計-主要參選人當選預測模型(下稱本模型),是以獲得專利之預測系統所建構。本模型過去曾精準預測 2016 年總統大選結果、2018 年地方選舉成功命中六都選舉結果、2020 年總統大選支持率預測誤差僅 1.3%、2020 年全國 73 席區域立委席次預測命中達 71 席、2022 年縣(市)長選舉本島 100% 精準預測。
本模型乃取自網路上與選舉相關之政黨、參選人之公開資料及社群網路數據,應用政治學、社會學、傳播學、心理學、經濟學、行銷學等選舉預測理論,建置數學模型,基於每天各種變動之因素,預測可能之選舉結果,非採傳統民意調查方式。但本模型仍參照公職人員選舉罷免法第 53 條第 1 項有關民意調查應揭露事項,說明如下:
一、分析單位 / 主持人
網路溫度計
二、分析範圍
2024 年第 16 屆總統副總統暨第 11 屆立法委員選舉主要參選人。
三、分析時間
以辦理期間內每一預測日前半年資料庫數據作為運算之基礎資訊,預測每一預測日之當選可能性(Probability of Victory)A。
四、辦理時間
2023 年 9 月 27 日至 2024 年 1 月 2 日(投票日前 11 日)。
五、分析方式(抽樣方式、母體數、樣本數)
本模型分析方式非採傳統抽樣之民意調查,係就蒐集之資料庫內容予以分析,無母體數、樣本數限制。本模型之分析資料來源如下:
- 1. 政黨版圖資料庫:取自中央選舉委員會選舉資料庫,該資料庫包含民國 83 年以來總統副總統、縣(市)長、立法委員(改制後)之選舉資料。
- 2. 網路口碑資料庫:透過「KEYPO 大數據關鍵引擎」網路爬蟲所建立每日累積 200 萬筆以上資料的網路數據庫,其內容涵蓋 Facebook、Instagram、PTT、YouTube、新聞媒體、討論區、部落格等社群或新聞網站。
- 3. 媒體民調資料庫:取自媒體委託或直接調查並發布之支持度民調報告。
六、誤差值
本模型非採用小樣本抽樣之民意調查,僅係當選可能性之預測,不適用民意調查之抽樣誤差值。
七、經費來源
大數據股份有限公司
貳、分析方法說明
一、分析目的
結合國內外選舉預測方法,設計參選人當選預測模型,並預測 2024 年總統副總統暨立法委員選舉主要參選人當選可能性A。
二、分析範圍
2024 年第 16 屆總統副總統暨第 11 屆立法委員選舉主要參選人。
三、分析時間
以辦理期間內每一預測日前半年資料庫數據,預測每一預測日主要參選人之當選可能性A。
四、分析變數
依各子模型描述之:
- 1. 基礎溫度:預測變數包含:政黨基本盤(過去四屆總統副總統暨立法委員選舉投票紀錄等)、參選人特質(包含參選人學歷、年齡、性別、政黨提名、選舉經歷、是否為現任者等資料)。
- 2. 社群溫度:預測變數包含:網路聲量B、好感度C、擴散廣度D、討論強度E等。
- 3. 粉絲溫度:預測變數包含:主要參選人 Facebook 粉絲專頁粉絲觸及力F、粉絲互動力G。
- 4. 民意溫度:預測變數包含:媒體民意調查H結果等。
五、資料統計方法與分析技術
- 1. 加權平均數:依各預測子模型之影響力計算加權平均數,得到各主要參選人的當選可能性A。
- 2. 迴歸分析:應用歷史選舉資料和選舉結果建置迴歸模型,以推估各主要參選人的預期當選可能性。
- 3. 語意分析:應用網路口碑資料庫,使用語意分析(Semantic Analysis)、情緒分析(Sentiment Analysis)等技術,汲取網路上相關參選人的討論文章,將文章分為正面、負面、中立三種情緒,作為本模型運算之基礎資訊。
- 4. 時間序列分析:依據媒體民調資料庫最新發布的民調結果,使用移動平均(Moving Average)的技術,計算各主要參選人在每個預測日的當選可能性A。
參、名詞解釋
- A. 當選可能性(Probability of Victory):主要參選人各項指標之互比平均值,主要參選人之加總為 100%,在不考慮其他參選人及投票率的情況下,所計算出主要參選人當選之可能性。
- B. 網路聲量:指每一預測日前一週內,網路討論該參選人之文章數,包含本文、回覆皆計算在內。
- C. 好感度:指利用 AI 語意分析、情緒分析技術,將網路聲量區分為正面、負面、中立三種情緒,並將正面情緒聲量數除以負面情緒聲量數所得比值。本模型並將正面情緒聲量數除以負面情緒聲量數計算好感度比值。
- C-1. 跨世代好感度:利用粉絲分析技術進一步計算不同年齡層之好感度,年齡層區分為 20-24 歲、25-39 歲、40-54 歲、55 歲以上。
- C-2. 情緒佔比:經 AI 情緒分析後的正面、負面、中立聲量之佔比。
- D. 擴散廣度:依主要參選人相關新聞擴散的頻道數計算其最大範圍。
- E. 討論強度:計算主要參選人的社群及討論區中,平均每一篇文章之回覆數(含回應符號數及留言數)。
- F. 粉絲觸及力:估計主要參選人 Facebook 粉絲專頁的活躍粉絲人數。
- G. 粉絲互動力:計算主要參選人 Facebook 粉絲專頁的互動情形,包括:按讚、留言、分享數加總。
- H. 媒體民意調查:指常態、週期性之媒體民意調查結果。