2024選戰溫度計

主要參選人當選預測模型分析說明

壹、預測模型說明

2024 選戰溫度計-主要參選人當選預測模型(下稱本模型),是以獲得專利之預測系統所建構。本模型過去曾精準預測 2016 年總統大選結果、2018 年地方選舉成功命中六都選舉結果、2020 年總統大選支持率預測誤差僅 1.3%、2020 年全國 73 席區域立委席次預測命中達 71 席、2022 年縣(市)長選舉本島 100% 精準預測。

本模型乃取自網路上與選舉相關之政黨、參選人之公開資料及社群網路數據,應用政治學、社會學、傳播學、心理學、經濟學、行銷學等選舉預測理論,建置數學模型,基於每天各種變動之因素,預測可能之選舉結果,非採傳統民意調查方式。但本模型仍參照公職人員選舉罷免法第 53 條第 1 項有關民意調查應揭露事項,說明如下:

一、分析單位 / 主持人

網路溫度計

二、分析範圍

2024 年第 16 屆總統副總統暨第 11 屆立法委員選舉主要參選人。

三、分析時間

以辦理期間內每一預測日前半年資料庫數據作為運算之基礎資訊,預測每一預測日之當選可能性(Probability of Victory)A

四、辦理時間

2023 年 9 月 27 日至 2024 年 1 月 2 日(投票日前 11 日)。

五、分析方式(抽樣方式、母體數、樣本數)

本模型分析方式非採傳統抽樣之民意調查,係就蒐集之資料庫內容予以分析,無母體數、樣本數限制。本模型之分析資料來源如下:

  • 1. 政黨版圖資料庫:取自中央選舉委員會選舉資料庫,該資料庫包含民國 83 年以來總統副總統、縣(市)長、立法委員(改制後)之選舉資料。
  • 2. 網路口碑資料庫:透過「KEYPO 大數據關鍵引擎」網路爬蟲所建立每日累積 200 萬筆以上資料的網路數據庫,其內容涵蓋 Facebook、Instagram、PTT、YouTube、新聞媒體、討論區、部落格等社群或新聞網站。
  • 3. 媒體民調資料庫:取自媒體委託或直接調查並發布之支持度民調報告。

六、誤差值

本模型非採用小樣本抽樣之民意調查,僅係當選可能性之預測,不適用民意調查之抽樣誤差值。

七、經費來源

大數據股份有限公司

貳、分析方法說明

一、分析目的

結合國內外選舉預測方法,設計參選人當選預測模型,並預測 2024 年總統副總統暨立法委員選舉主要參選人當選可能性A

二、分析範圍

2024 年第 16 屆總統副總統暨第 11 屆立法委員選舉主要參選人。

三、分析時間

以辦理期間內每一預測日前半年資料庫數據,預測每一預測日主要參選人之當選可能性A

四、分析變數

依各子模型描述之:

  • 1. 基礎溫度:預測變數包含:政黨基本盤(過去四屆總統副總統暨立法委員選舉投票紀錄等)、參選人特質(包含參選人學歷、年齡、性別、政黨提名、選舉經歷、是否為現任者等資料)。
  • 2. 社群溫度:預測變數包含:網路聲量B、好感度C、擴散廣度D、討論強度E等。
  • 3. 粉絲溫度:預測變數包含:主要參選人 Facebook 粉絲專頁粉絲觸及力F、粉絲互動力G
  • 4. 民意溫度:預測變數包含:媒體民意調查H結果等。

五、資料統計方法與分析技術

  • 1. 加權平均數:依各預測子模型之影響力計算加權平均數,得到各主要參選人的當選可能性A
  • 2. 迴歸分析:應用歷史選舉資料和選舉結果建置迴歸模型,以推估各主要參選人的預期當選可能性。
  • 3. 語意分析:應用網路口碑資料庫,使用語意分析(Semantic Analysis)、情緒分析(Sentiment Analysis)等技術,汲取網路上相關參選人的討論文章,將文章分為正面、負面、中立三種情緒,作為本模型運算之基礎資訊。
  • 4. 時間序列分析:依據媒體民調資料庫最新發布的民調結果,使用移動平均(Moving Average)的技術,計算各主要參選人在每個預測日的當選可能性A

參、名詞解釋

  • A. 當選可能性(Probability of Victory):主要參選人各項指標之互比平均值,主要參選人之加總為 100%,在不考慮其他參選人及投票率的情況下,所計算出主要參選人當選之可能性。
  • B. 網路聲量:指每一預測日前一週內,網路討論該參選人之文章數,包含本文、回覆皆計算在內。
  • C. 好感度:指利用 AI 語意分析、情緒分析技術,將網路聲量區分為正面、負面、中立三種情緒,並將正面情緒聲量數除以負面情緒聲量數所得比值。本模型並將正面情緒聲量數除以負面情緒聲量數計算好感度比值。
    • C-1. 跨世代好感度:利用粉絲分析技術進一步計算不同年齡層之好感度,年齡層區分為 20-24 歲、25-39 歲、40-54 歲、55 歲以上。
    • C-2. 情緒佔比:經 AI 情緒分析後的正面、負面、中立聲量之佔比。
  • D. 擴散廣度:依主要參選人相關新聞擴散的頻道數計算其最大範圍。
  • E. 討論強度:計算主要參選人的社群及討論區中,平均每一篇文章之回覆數(含回應符號數及留言數)。
  • F. 粉絲觸及力:估計主要參選人 Facebook 粉絲專頁的活躍粉絲人數。
  • G. 粉絲互動力:計算主要參選人 Facebook 粉絲專頁的互動情形,包括:按讚、留言、分享數加總。
  • H. 媒體民意調查:指常態、週期性之媒體民意調查結果。