יום חמישי, ארבע פעמים כי טוב. עוד יום של טורניר. אולי גם של הפתעות. משחק תחזית המונדיאל של המדד וכאן חדשות מתקדם, אתם ואתן מתבקשים או להצטרף (אם עוד לא הצטרפתם), או לעדכן את התחזית שלכם (אם עוד לא עדכנתם). יש סיבות לעדכן, תכף ניגע בכמה מהן. רק נזכיר שהמשחק שלנו שונה משאר תחזיות המשחקים. זה משחק שמתנהל קצת יותר ברצינות, כולל בחינה של מאפייני הרקע של המשתתפים, והשפעת המאפיינים על התחזיות. עכשיו חמש הערות ליום חמישי:
מוכנים או לא מוכנים להתפשר על פסקת התגברות? בואו לבדוק את שאלון הפשרות המסקרן של המדד
1.
ארגנטינה? ברצינות? ראינו את הנבחרת משחקת. ראינו אותה מפסידה. נכון, זה רק משחק ראשון, והיא עוד יכולה להתאושש. צריך לקוות שתתאושש, ולא תודח כמו גרמניה ב-2018 בשלב הבתים. ובכל זאת, להניח בשלב הזה שארגנטינה היא המנצחת הצפויה של הטורניר נראה קצת נועז. בדקנו: האם היא עדיין המנצחת של הטורניר על פי משתתפי המשחק? התשובה היא כן, אבל זו תשובה מורכבת. צריך לקחת בחשבון שחלק גדול מהמשתתפים עד כה חזו את כל הטורניר, ומאז לא חזרו לעדכן. זה אומר שאם לפני שבוע הם הימרו על ארגנטינה, זה מה שיש גם עכשיו, בלי שינוי. בדקנו: מה עם אלה שחזרו לעדכן ממש ביומיים האחרונים? מעניין – לא רואים שינוי גדול. כלומר, גם אצלם ארגנטינה בולטת כבעלת סיכוי גדול לזכות. בעיני זה משונה, אבל אני לא מתווכח עם אוהדים שמאמינים בנבחרת שלהם. כך או כך, הנה הגרף שמתאר את ההתפלגות העיקרית של התחזית למשחק הגמר. שימו לב: זו לא התפלגות במענה לשאלה ״מי ינצח״ אלא התפלגות של מי שהשלימו תחזית לכל משחקי הטורניר, כולל הגמר (יש כמה מאות כאלה).
2.
בדקנו גם את הצלחת התחזית שלנו, ועשינו את זה בחלוקה לשלוש קטגוריות: משחקים שבהם חזינו נכון את המנצחת וגם את הפרש השערים (לא את מספר השערים המדויק, אלא את הפער בשערים בין הקבוצות – לפחות בערך). זה אומר שאם חזינו למשחק פולין-מקסיקו את התוצאה 1.5-1.6 (בשערים) אנחנו מחשיבים את זה כתחזית נכונה גם בתוצאה (תיקו) וגם בהפרש השערים (אותו מספר – במקרה של המשחק הזה, בלי שערים לשתי הקבוצות). בקטגוריה השנייה הצבנו משחקים שחזינו בהם נכון את המנצחת אבל לא את הפרש השערים. נאמר, ספרד-קוסטה ריקה. התחזית ידעה לומר מראש שספרד תנצח, ולא חזתה את הבליץ הקטלני של השערים. הקטגוריה השלישית היא של תחזית לא נכונה. כמו ארגנטינה-סעודיה. רק חצי אחוז מהחזאים שלנו אמרו מראש שסעודיה תנצח (זה חזאים בודדים).
אז כמה הצלחנו? הנה הנתונים. באופן טבעי, קל יותר כשאין הפתעות, קשה יותר כשיש הפתעות. בחיזוי ההפתעות הגדולות לא היינו טובים – בממוצע. אבל היו בכל זאת מי שחזו הפסד לארגנטינה, והיו מי שחזו הפסד לגרמניה מול יפן. בהמשך נוכל לבחון האם חזאי ההפתעות מצליחים בשיעור גבוה יותר, או שסתם היה להם מזל עם משחק אחד שחרג מהשגרה.
3.
מילה כללית על סטטיסטיקה וכדורגל. במהלך המשחקים נשלפים הרבה נתונים על משחקים קודמים וטורנירים קודמים של הנבחרות השונות. כדאי לשים לב שרוב גדול של הנתונים האלה לא רלבנטיים מאחת משתי סיבות. או שמספר התצפיות נמוך מכדי להסיק ממנו מסקנה (נבחרת שהשתתפה פעם אחת בגביע העולם שיחקה בסך הכל כמה משחקים, זה מעט מכדי לייצר נתונים משמעותיים). ועוד: חלק גדול מהתצפיות מתייחסות לנבחרת אחרת, שיש לה את אותו שם. נכון – זו ״יפן״ וגם זו ״יפן״. אבל למה שתעשה נבחרת יפן של השנה אין שום קשר למה שעשתה נבחרת יפן לפני עשר שנים. כך שהעובדה ש(אני ממציא, לא יודע אם זה נכון) ״יפן מעולם לא ניצחה את גרמניה״ אין שום משמעות. התוצאה של היום נקבעת על ידי הנבחרות שמשחקות היום, ולמה שקרה לשתי נבחרות אחרות בעלות אותו שם לפני עשרים שנה, או ארבעים שנה, פשוט אין חשיבות.
למה בכל זאת יש חשיבות? לעובדה כמו ״ארגנטינה לא הפסידה ב-35 המשחקים האחרונים שלה״. זו סטטיסטיקה שאומרת משהו על הנבחרת שמשחקת בטורניר הזה. אם כי, כפי שראינו, גם מנתון כזה לא כדאי לגזור מסקנה נחרצת.
4.
שימו לב לתחזית גביע העולם של האתר 538. זו תחזית שמבוססת על הישגים, דירוג, ועוד כל מיני תחשיבים מסובכים (על בסיס דירוג ELO). לא על מה שאומרים צופי וחובבי כדורגל, אלא על מה שאומרת הסטטיסטיקה. גם לתחזית הזאת יש הרבה מאוד חסרונות, ובכל זאת, מעניין להשוות תחזיות שמבוססות על נתונים מכל מיני סוגים. קיבצנו שלוש: שלנו, של 538 ושל המהמרים בווגאס. כפי שאפשר לראות, רק שתי קבוצות מופיעות בכל שלוש האפשרויות, ברזיל וצרפת – אולי גם זה אומר משהו?
5.
וזאת התחזית למשחקים של היום. הפוטנציאל המרכזי להפתעות גדולות: הפסדים, או אפילו תיקו, של ברזיל ופורטוגל.