כמעט בכל מערכת בחירות, יש “הפתעת בחירות.” הסקרים אומרים משהו אחד - והתוצאות אחרת. האם ניתן לעשות יותר טוב?

תחזית מנדטים (לחץ כדי להגדיל)

בתחזית הסופית, כחול-לבן עוקפת את הליכוד במעט. עקב ריבוי המפלגות, אחוז החסימה הגבוה, והעדר הסקרים בימים האחרונים לקראת הבחירות, אי הוודאות גבוהה. הדבר היחידי שניתן לומר בוודאות יחסית היא שארבע מפלגות - הליכוד, כחול-לבן, העבודה, ויהדות התורה - יהיו בכנסת הבאה ,בעוד לשאר המפלגות יש סיכוי מסויים שלא יעברו את אחוז החסימה. על בסיס הסקרים הנוכחיים, הליכוד עלול לקבל בין 23 ועד 34 מנדטים, בעוד שכחול לבן תקבל בין 25 עד 36 מנדטים. ההתפלגות המדוייקת מצויינת מתחת לעמודות המנדטים. הסיכוי שמפלגה מסויימת לא תעבור את אחוז החסימה מצויין מעל העמודה האדומה לידה. הטווח (כגון 23-34 לליכוד או 25-36 לכחול-לבן) הוא טווח המנדטים במסגרת טווח הסמך של 95% לאותה מפלגה.

ניתן לראות כיצד מתפתחת התמיכה במפלגות כמו גם אי הוודאות (במיוחד בתקופת “עוצר הסקרים”) בגרף הזה:

התפתחות התמיכה לאורך זמן (לחץ כדי להגדיל)

כדי להתמודד עם אי הודאות, המודל בוחר דגימה ייצוגית שהכי קרובה לממוצע. אנחנו עתה ב”עוצר הסקרים” עד הבחירות. בתקופה זו, הרבה יכול לקרות. ב 2015, היה דומה שהסקרים האחרונים מצביעים על “שינוי משחק” של הרגע האחרון לטובת המחנה הציוני, ופרשנים פוליטיים פרשנו את הפסד הליכוד הצפוי. המגמה התחברה באופן ישיר למסרי הליכוד לאורך הקמפיין וכתוצאה, מצביעים רבים למפלגות ימין קטנות כנראה שינו את הצבעתם ברגע האחרון לטובת הליכוד. הליכוד ניצח בהפרש גדול, והיה ל”הפתעת הבחירות.”

היום, נראה שהסקרים יותר יציבים ולא נראה שיש “שינוי-משחק” דומה של הרגע האחרון. הוידאו המוזר של זהות אולי מהווה כזה לטוב ולרע, אך השפעתו ככל הנראה מוגבלת למפלגת זהות. אין לו השפעה על המפלגות הראשיות - כחול-לבן וליכוד. ייתכן שהשיקולים הללו כבר מחושבים בתוך הסקרים.

הבעיה העיקרית הפעם היא שיש מפלגות רבות על גבול אחוז החסימה. המודל מצפה שלגשר יש 80% סיכוי שלא תעבור את אחוז החסימה, לישראל ביתנו יש 63% סיכוי לא לעבור את אחוז החסימה, ורע”ם-בל”ד לא תעבור את אחוז החסימה בסבירות של 58%. מבין המפלגות שהמודל בעריך בסבירות גבוהה יותר שיעברו, לכולנו יש סיכוי של 1 ב 4 לא לעבור את אחוז החסימה, לש”ס יש סיכוי של 1 ב 5, למרצ סיכוי של 1 ב 6, ולזהות סיכוי של 1 ב 7 לא לעבור את אחוז החסימה.

לצורך השוואה והדגמת השונות הצפויה במנדטים, הנה 5 התוצאות הכי מייצגות (מתוך 5000 הדגימות):

כחול-לבן הליכוד העבודה חד”ש-תע”ל יהדות התורה ש”ס איחוד מפלגות הימין הימין החדש זהות כולנו רע”ם-בל”ד מרצ מגן גשר ישראל ביתנו
31 28 10 8 7 6 6 6 5 5 4 4 0 0 0
30 29 10 6 6 5 8 6 5 6 4 5 0 0 0
31 29 8 7 7 5 7 7 4 5 4 6 0 0 0
31 29 9 9 7 6 7 6 7 4 0 5 0 0 0
32 30 9 8 7 5 5 6 5 4 4 5 0 0 0

תחזית קואליציות

Coalitions Forecast (לחץ כדי להגדיל)

גם אם מפלגה אחת או שתיים לא תעבור, הקואליציות שעלולות לקום יותר ודאיות. ב 2015, נתניהו הקים ממשלה צרה מאוד של 61 ח”כים. וזה מאוד סביר גם כאן – יש סיכוי של כ 90% שנתניהו יוכל להקים ממשלת ימין צרה, וסיכוי טוב של 60% שנתניהו יוכל להקים ממשלת ימין יציבה של 65 ח”כים ומעלה. גודל הקואליציה הממוצע של ממשלת ימין בראשות נתניהו צפוי להיות כ 66 ח”כים. במידה שאכן תקום ממשלת ימין יציבה כזו, על המפלגות הקטנות לקוות שישיגו לפחות 6 מנדטים, מה שיחייב את נתניהו להכנע לדרישותיהן בעוד שלמפלגות שישיגו 4 או 5 מנדטים יהיה כוח מיקוח קטן מאוד.

לכחול-לבן סיכויים דומים להקים ממשלת “יהודים בלבד”, על הנייר. אבל לא סביר שהמפלגות החרדיות יצטרפו לכחול-לבן עם הייצוג הנכבד של יש עתיד - לפיד הוא אחד המועמדים לראש הממשלה ומצע המפלגה מבוסס במידה רבה על מצעה החילוני של יש עתיד. כמו כן, הסיכויים להקים ממשלת אחדות קיימים - השאלה אם זה מה שנתניהו רוצה. (היחס לכחול-לבן הוא כיחידה אחת לצורך חישובי ממשלת אחדות).

על המודל

בארה”ב ובמקומות אחרים, סטטיסטיקה בייסיאנית וחישוב מחרוזות מרקוב מונטה קרלו (MCMC) שימשו לתחזיות בחירות באתרים דוגמת 538 של נייט סילבר כמו גם אחרים. זה הצליח יפה מאוד ב 2008 וב 2012. ב 2016, אתר 538 עדיין “פספס” אך בכל זאת העריך שלטראמפ סיכויים של 30% לנצח.

אני מציג כאן את התחזית הסופית של מודל דומה שמותאם לישראל, המחושב בשיטות MCMC. המודל הוא קוד פתוח וניתן לקרוא איך להריץ אותו וגם פרטים טכניים יותר בפוסט נפרד באנגלית. בקצרה, המודל הוא ממוצע סקרים משוכלל (“סקר של סקרים”) שמתחשב בקשרים בין המפלגות (מטריצת מתאמים) והטיות סוקרים. הוא מבוסס על 58 סקרים שנערכו מאז 21 פברואר 2019, היום שבו הוגשו הרשימות הסופיות לוועדת הבחירות. ניתן לראות את רשימת הסקרים המלאה כאן. שלושה סקרים שנערכו לאחר 21 פברואר 2019 (בנוסף על אותם 58 סקרים) אינם כלולים בגלל שלא פורסם מידע מספק. התוצאות מבוססות על ההתפלגויות ב 5000 דגימות מחושבות.

היתרונות של המודל:

  • הוא מסוגל להתחשב בהטייה של סוקר מסויים - אם סוקר מסויים באופן עקבי מעריך מפלגה ספציפית מעל או מתחת לממוצע, המודל יאתר זאת. הטיות כאלו עלולות להיות תוצאה של העדפה מכוונת (למשל, אם מכון הסקרים גם משמש כסוקר הפנימי של אותה מפלגה). אבל זה עלול להיות גם תוצאה לא מכוונת - טעות בשקלול הנתונים הדמוגרפיים, ניסוח השאלות, וכדומה.
  • המודל מסוגל להתחשב בצורות השונות שהמפלגות הקטנות לא יעברו את אחוז החסימה - המודל מחשב אלפי דגימות שתואמות את הסקרים. בכל דגימה, חלק מהמפלגות אולי יעברו את אחוז החסימה ואחרות לא. המודל מתחשב באפשרויות השונות לצורך חישוב הקואליציות.
  • המודל מסוגל להתחשב בקשרים בין המפלגות - הוא משתמש בסקרים עצמם כדי להבין איך המפלגות קשורות אחת בשניה. לדוגמא, כשהוא מוצא שלחד”ש-תע”ל ורע”ם-בל”ד יש מתאם שלילי, התוצאות ישקפו זאת. אם בדגימה מסויימת, חד”ש-תע”ל מקבלת מעל לממוצע, אזי רע”ם-בל”ד תקבל מתחת לממוצע, ולהיפך.

אך למודל יש גם את מגבלותיו:

  • הוא אינו יכול להתחשב בשינויים בזמן “עוצר הסקרים,” אותם ימים לפני הבחירות שבהם אסור לפרסם סקרים. לדוגמא, נגיד שוידאו מסויים מופץ בסוף השבוע האחרון לפני הבחירות בזמן ש”עוצר הסקרים” כבר בתוקף. אם בוחרים מסויימים משנים את דעתם כתוצאה מהוידאו, למודל אין דרך לצפות ארוע כזה. (יש מישהו שכן?)
  • הוא אינו יכול לחשב שגיאת סקרים עקבית הקיימת בכל הסקרים. לדגומא, אם הסוקרים כולם צופים שלמפלגה מסויימת יש אחוזי תמיכה דומים שבפועל הם מעל או מתחת לאחוז התמיכה האמיתי, המודל יהיה מבוסס על תוצאת הסקרים הממוצעת. אין כל ניסיון לתקן או לפצות על שגיאת סקרים עקבית.
  • המודל אינו מנסה להתחשב במצביעים שעוד לא החליטו למה להצביע ולא מנסה להתחשב במצביעים שבטוחים שיצביעו. לגבי שני גורמים אלו, המודל סומך על החישובים של הסוקרים עצמם.

לכו להצביע!