כל משחק הוא לא הוגן אם משחקים לא נכון…

החברים במכון דוידסון עושים לרוב עבודה מצויינת בכתיבה מדעית פופולרית והנגשת רעיונות מדעיים לציבור הרחב (למשל, דרך דף הפייסבוק). לרוב, כי היום משהו התקלקל והכתבה הבאה יצאה תחת ידיהם והופיעה ב-ynet. הכתבה עוסקת במשחק הפשוט "זוג או פרט" ומנסה להסביר שהמשחק לא הוגן וכי הסיכויים של "זוג" לנצח הם במעט יותר גבוהים (13/25 לעומת 12/25). הואיל ויש לי כמה דקות פנויות והטעויות בכתבה באמת מפריעות לי, הריהו לפניכם – פוסט התיקונים.

הכתבה נפתחת בהסבר קצר על המשחק ועל האם זה "פרד" או "פרט" ומיד אחרי זה מגיעה השגיאה הראשונה בחישוב ההסתברויות. הכתב סופר נכונה שכאשר כל אחד מהשחקנים מציג אצבע עד 5 אצבעות ולכן יש בסה"כ 25 תוצאות אפשריות במשחק (1-1, 1-2, 2-1 וכו' עד 5-5) מתוכן 13 זוגיות ורק 12 אי-זוגיות, אבל המסקנה המתבקשת היא לא שהסיכוי לתוצאה זוגית יותר גדולה מתוצאה אי זוגית. מדובר על כשל בהבנת מושג ההסתברות. העובדה שיש 13 תוצאות זוגיות ו-12 תוצאות אי זוגיות לא אומר שהסיכוי לתוצאה זוגית הוא 13/25. שיקול כזה עובד רק בבעיות בהן הסיכוי לכל תוצאה הוא שווה (מצב הנקרא "מרחב מדגם סימטרי") כמו בקוביה (6 תוצאות עם אותו הסיכוי) או הטלת מטבע (שתי תוצאות עם אותו סיכוי) אבל לא כל מרחב מדגם הוא סימטרי. הסיכוי שירד מחר גשם הוא לא 50% (או שכן או שלא) והסיכוי שנבחרת ישראל תסיים במקום הראשון במוקדמות המונדיאל הבא הוא לא 1/6 (כי יש 6 מקומות אפשריים). אותו הדבר במשחק "זוג או פרט". התוצאה שמציגים בכתבה נכונה רק אם כל אחד מהשחקנים בוחר באקראי כמה אצבעות להציג, ולכל מספר של אצבעות יש סיכוי של 1/5.

שתי פסקאות אחרי כן, הכתב מוכיח שהוא כן מבין את הנקודה האחרונה, כשהוא מסביר שהסכומים האפשריים במשחק אינם שווי הסתברות. אכן, הסיכוי לקבל 10 (אם כן אחד בוחר מספר באקראי) הוא 1/25 בעוד שהסיכוי לקבל 9 גבוה פי 2 (כי יש שתי אפשרויות לקבל 9: 5+4 או 4+5). לכן לחשוב על כל התוצאות האפשריות (2 עד 10) ולהגיד שהן תוצאות שוות הסתברות היא אמירה לא נכונה למרות שהיא גם מובילה למסקנה של"זוג" יש יתרון על "פרט".

כל חישובי ההסתברות הללו, נכונים ככל שיהיו, סוטים מהנקודה המרכזית שחסרה בניתוח. מדובר על משחק ולכן שחקנים רציונליים יחפשו אסטרטגיה במשחק. כשם ששחקנים אינם בוחרים מהלכים באקראי במשחק השחמט, כך אין סיבה שיבחרו באקראי אצבעות במשחק "זוג או פרט". נניח למשל ש"זוג" קרא את הכתבה בויינט והחליט לפעול לפי האסטרטגיה המומלצת שם, כלומר להציג כל מספר של אצבעות באותו סיכוי. האם "פרט" יכול להגן על עצמו? בוודאי. ראשית כל, הוא יכול לבחור להציג אצבע אחת בסיכוי של חצי ו-2 אצבעות בסיכוי של חצי. במקרה כזה, הסיכוי שלו לנצח אם הוא הראה אצבע אחת (מה שקורה בסיכוי חצי) הוא 2/5 ואם הוא הראה שתי אצבעות (שוב, בסיכוי חצי) הוא 3/5 ובסה"כ הסיכוי שלו לנצח יהיה מכפלת ההסתברויות, כלומר חצי. לפיכך, "פרט" יכול להבטיח שינצח בערך בחצי מהמשחקים אם הוא בוחר באקראי "זוג" או "פרט" ובהתאם לכך בוחר כמה אצבעות יציג ולא אם הוא בוחר באקראי את מספר האצבעות שיציג. באופן דומה, "זוג" יכול לנקוט באסטרטגיה דומה והמשחק יהפוך להוגן – הסיכוי של כל אחד לנצח הוא בדיוק חצי.

למעשה, "זוג" חייב לנקוט באסטרטגיה דומה אחרת הוא יפסיד. אם משום מה "זוג" מתעקש לנקוט באסטרטגיה של ויינט ולהציג כל מספר אצבעות באותו סיכוי, הרי שהוא יציג מספר אי זוגי ב-3/5 מהמקרים ולכן "פרט" יכול פשוט להציג מספר זוגי תמיד ולנצח ב-3/5 מהמקרים. לאור זאת, גם "זוג" חייב לשחק אסטרטגיה שמציגה זוג ופרט בסיכויים שווים אחרת "פרט" יוכל לנצל את האסטרטגיה השגויה של "זוג" לטובתו.

בסיכומו של עניין, "זוג או פרט", כמו הרבה משחקים אחרים, הוא משחק הוגן בהנחה שמשחקים נכון ואז לכל צד יש סיכוי של חצי לנצח. יתרה מכך, מספיק שאחד הצדדים ישחק נכון ויבחר זוג ופרט בהסתברות שווה כדי לוודא שהמשחק יהיה הוגן וכל צד ינצח בהסתברות חצי. הבעיה היחידה יכולה להתעורר במשחק היא אם משחקים לא נכון או מנסים להתחכם ("הוא עשה 2 אז עכשיו הוא בטח לא יעשה 2 ולכן אני אעשה 2….").

נהפוך את המשחק למעניין ונניח שהמנצח משלם למפסיד שקל. במקרה כזה המשחק הופך למשחק סכום-אפס, שכן סך כל הרווחים של השחקנים הוא 0 (כל מה שאחד מרוויח, השני בדיוק מפסיד). פון-ניומן, מאבות תורת המשחקים, הוכיח בשנות ה-40 שלמשחקי סכום-אפס עם שני שחקנים יש ערך, כלומר יש לכל צד אסטרטגיה אופטימלית ויש ערך בודד המתאר כמה, בממוצע, שחקן 2 ישלם (או ירוויח, שקול לתשלום שלילי) בכל תור. ב"זוג או פרט" השחקן הראשון ירוויח 1 בחצי מהמשחקים, יפסיד 1 בחצי מהמשחקים ולכן בממוצע ירוויח 0, כלומר הערך של המשחק הוא 0.

מבחינה תאורטית, אם כך, המשחק "זוג או פרט" הוא די משעמם כי האסטרטגיות האופטימליות ידועות, הערך ידוע ואין כל כך מה לחדש. דווקא מבחינה פרקטית המשחק עשוי לעניין שכן לא סביר שאנשים באמת משחקים "1 בהסתברות חצי ו-2 בהסתברות חצי" כמו שצריך. מחקרים מראים שקשה מאוד לאנשים להגריל מספרים בצורה אקראית והחשיבה האנושית היא מובנית ומבוססת על סדרות: "שיחקתי עכשיו פעמיים 1, אבל אני אמור לשחק חצי חצי ולכן בתור הבא אשחק 2 כדי שזה יהיה בערך חצי-חצי" (בניגוד לאמירה הנכונה: "שיחקתי עכשיו פעמיים 1, עכשיו אני אשחק או 1 או 2 באופן אקראי לחלוטין"). כתבה על מחקר כזה, המתאר מה אנשים משחקים בפועל ואיך אפשר לנצל את זה כדי לנצח ולהשתלט על העולם, הייתי שמח לקרוא.

ביקורת ספר: העורך העירום – איך תורת המשחקים קובעת על מה כולם ידברו מחר

לאחר שכיהן בשורה של תפקידים בכירים בתקשורת הישראלית (ערוץ 10, "מעריב", mako וכו') התפנה אורי רוזן לכתוב ספר המתאר את עולם התקשורת מבפנים בראי תורת המשחקים. דווקא תורת המשחקים היא החלק החלש ביותר בספר. עוד מראשית ימיה, תורת המשחקים זכתה ליחסי ציבור טובים, בין אם על ידי בחירה בשמות מצויינים לבעיות מתמטיות פחות מרגשות באופן אובייקטיבי ("דילמת האסיר" לדוגמא, או "מלחמת המינים") או על ידי סרטים דוגמת "נפלאות התבונה" וספרי מדע פופולרי רבים מספור. לכן, בהיבט התורת משחקימי הספר לא מחדש הרבה. יש גבול לכמות הדרכים השונות בהן ניתן לספר על דילמת האסיר  או לתאר את שיווי משקל נאש. בספר הזה מתוארים בקצרה מרבית המודלים בתורת המשחקים וקבלת החלטות, החל במודלים הבסיסיים כמו דילמת האסיר, שמככבים בספריו של חיים שפירא, דרך ערעור מסויים על המודלים, בטענה שאנשים הם למעשה לא רציונליים (כפי שכתב בהרחבה דן אריאלי בסדרת ספריו) וכלה במודלים פחות מסופרים כמו המצביע החציוני (מודל הוטלינג). כאמור הכתיבה היא די סטנדרטית ומי שמעוניין ללמוד על תורת המשחקים יעדיף לבחור ספר פופולרי אחר ולא את הספר הזה.haorech_haeirom_front(2)

הייחודיות של "העורך העירום" היא בהצצה שהוא מספק אל מאחורי הקלעים של עולם התקשורת. אורי רוזן דן בתאוריות של תורת המשחקים ומשתמש בדוגמאות מעולם התקשורת כדי להמחישן. כך למשל, הוא משתמש בדילמת האסיר כדי להסביר מדוע ערוצי טלוויזיה פותחים אולפנים וגלים פתוחים כשאירועים דרמטיים עשויים לקרות או קרו, גם מבלי שיהיה להם מה לחדש, כמו שקרה עם חזרת גלעד שליט. כל הערוצים היו שמחים להסתפק בשידורים קצרים וממוקדים אבל הפחד שהערוץ האחר יעשה שידור ארוך יותר ויגרוף יותר רייטינג גורמת לטחינת מים קולקטיבית למגינת ליבם של העורכים בכל האולפנים (הדוגמא הספציפית הזו היא מאוד בולטת וכבר יצא לי לרשום עליה כאן).

באחד מרגעי השיא של הספר מתאר אורי רוזן את האופן בו נחשפה פרשת המניות של דן חלוץ ומי הוא המדליף שלה (רמז, המדליף היה רמטכ"ל בצבא באותה תקופה. בפסקה האחרונה של הלינק הבא תמצאו את התשובה ואת אופן ההדלפה המפתיע). רגע זה מצטרף לשורה ארוכה של סיפורים המתארים בגילוי לב את הדרך הצינית לעיתים בה עיתונים בוחרים אג'נדה, האופן בו נבחרות כותרות עיתונים, ליינאפים של תוכניות וטריקים שנועדו להשפיע באופן לא מודע על הקורא להזדהות עם העמדה הרצויה.

יותר מאשר ספר על תורת המשחקים זהו ספר חשוב מאוד על תקשורת ומהווה חומר קריאה הכרחי לכל מי שטרח מדי פעם לפתוח עיתון, לשמוע מהדורת חדשות ברדיו או לראות טלוויזיה – כולנו. הספר יעזור לכם להיות יותר מודעים למניפולציות המתרחשות על בסיס יום יומי ויאפשרו לכם להבין יותר טוב מה אתם רואים בטלוויזיה ולמה.

בשתי מילים – מומלץ בחום.

ואם זה לא שיכנע אתכם – הנה ביקורת פחות אוהדת.

ריאליטי שליט – אין טעם לזפזף

דילמת האסיר הוא ללא ספק אחד המשחקים המפורסמים בתורת המשחקים. התיאור החביב עליי כולל שני חשודים הנתפסים ונחקרים בעוון ביצוע פשע כלשהו. החשודים נחקרים במשך שעות בחדרי חקירה נפרדים, המשטרה פושטת על בתיהם ובאופן כללי, מנסה ככל הניתן למצוא את האקדח המעשן. בהיעדרו ובלית ברירה, המשטרה מציעה לכל אחד מהחשודים להפוך לעד מדינה ולהעיד כנגד חברו. "אם שניכם תמשיכו לשתוק, יש לנו מספיק ראיות בכדי לכלוא אתכם לשנה בכלא. שנה בכלא זה הרבה זמן, בוודאי לבחור עדין כמוך, ולכן אנחנו מציעים לך להעיד נגדו. אתה תשתחרר מיד והוא ייכלא ל-20 שנים". בכדי להשלים את התמונה החוקר מוסיף "ואם שניכם תודו, נכניס אתכם לכלא רק לעשר שנים, כבונוס על שיתוף הפעולה".

מה אתם הייתם עושים?

כשמנתחים את המשחק רואים מיידית שהכי טוב מבחינת שניהם הוא לשתף פעולה ולא להודות. כך הם יוכלו להשתחרר תוך שנה ולהתחיל חיים חדשים. הבעיה, שבמשחק הזה יש אסטרטגיה שולטת, כלומר אסטרגיה עדיפה לא משנה מה החשוד השני יעשה. כך למשל, אם החשוד השני אכן החליט לא להודות, עדיף להודות ולקצץ גם את שנת המאסר הזו על פני לא להודות ולשבת שנה בכלא. מצד שני, אם אנחנו סבורים שהולכים לבגוד בנו ולהעיד נגדנו, שוב עדיף להודות גם כן ולהסתפק רק ב-10 שנים ולא לרצות את מלוא חומרת הדין. כך יוצא שבמקום לשתף פעולה ולרצות שנה אחת בלבד, החשודים יבגדו זה בזה ויתקעו בכלא למשך עשר שנים ארוכות של תפיסת ראש וניסיונות להבין איפה הם טעו.

הניתוח לעיל טוב ויפה כל עוד הסיטואציה חד פעמית. אבל שוו לעצמכם מצב בו האסירים נדרשים להתמודד עם הדילמה שוב ושוב. בעוד שבמשחק החד פעמי שיתוף פעולה אינו אפשרי, הרי שבמשחק אפשר לבנות יחסי אמון בין הצדדים ולשתף פעולה לאורך זמן. למשל, שני הצדדים יכולים להחליט שהם לא מודים עד שהם נבגדים ומרגע זה והלאה מודים כל הזמן. לאף אחד מהצדדים לא שווה להפר את הברית כי הרווח מכך שיבגוד פעם אחת בטל בשישים מכל ההפסדים העתידיים מכך ששיתוף הפעולה ובמקום לצבור שנה אחת בכלא בכל פעם הם יצברו 10 שנים (או נקודות רעות, או יפסידו כסף, תכניסו כאן איזה סיפור אחר שתרצו שיתאים יותר לחזרה על הסיטואציה הרבה פעמים) ויפסידו. דרך אחרת להבטיח שיתוף פעולה היא אסטרטגיה בה לא מודים בסיבוב הראשון ועושים מה שהשני עשה בסיבוב הקודם. ככה, בגידה נענית בבגידה ושיתוף פעולה נענה בשיתוף פעולה. גם כאן ברור שעדיף לשני הצדדים לשתף פעולה.

מה קשורה דילמת האסיר לעניין שליט פרט להיותו אסיר לשעבר בשבי החמאס? התשובה מסתתרת בצידה השני של העדשה, בתקשורת. לתקשורת שתי אסטרטגיות לסיקור שחרור שליט. האפשרות האחת היא לסקר את חזרתו לארץ ולהותירו לנפשו. מרגע שהוא בבית הוא כבר לא ממש מושא לעניין. שיאכל מה שבא לו, יטייל כאוות נפשו ובאופן כללי, יחיה את חייו. אני בטוח שאפשר למצוא בארץ חדשות אחרות שאינן קשורות אליו. האסטרטגיה השניה היא בדיוק מה שקורה עכשיו, קרי חטטנות בלתי נלאית בכל בדל מידע שקשור או לא קשור לחייו, ראיונות חסרי טעם וחסרי עניין עם מורים לשעבר, המיילדת שלו, המוכר שלו במכולת ומישהו שראה את המסוק שלו מרחוק, פעם, כששירת בתל נוף בשנות ה80. מרתק, בהחלט.

על פניו התשובה ברורה, אלא שהתקשורת היא לא גוף אחד ומורכבת מהרבה גופים, כל אחד מהם ניצב בפני הדילמה "לסקר או לא לסקר". אם כולם לא יסקרו, הכל יהיה בסדר. אבל אם אחד יבגוד ויסקר את גלעד שליט, הוא ימשוך אליו המון רייטינג וירוויח. כתוצאה מכך לכולם ברור שהבחירה הנכונה היא "לא לסקר", ובכל זאת, כולם בוגדים בכולם, מסקרים ואחרי זה גם מסקרים את הסיקור שלהם ומתלוננים שהתקשורת חטטנית.

עד כאן הגיוני. אלא ששליט לא בודד ומדובר כאן על דילמת האסיר עם חזרות. אתמול שליט, לפני כמה שנים שרון התמוטט, מחר עוד משהו יקרה. במצב כזה הגיוני היה להניח שכולם יניחו לו לנפשו ולא יסקרו.

אז למה כולם מסקרים?

שתי סיבות. כי הפיתוי גדול והעונש לא חמור. להפך. 45% הרייטינג מאתמול מלמדים שהציבור רוצה את זה, צריך את זה ומבקש את זה. עד שהציבור לא יתחיל להעניש את התקשורת על הסיקור המוגזם לא יווצר מצב אמיתי של דילמת האסיר שיחייב את התקשורת לחזור לשפיות ולסקר אירועים פעם אחת כשהם קורים ולא שלוש פעמים ("מחר שליט יוחזר!!! היום שליט הוחזר!!! אתמול שליט הוחזר!!!"). אז במקום להלין בטוקבקטים הצביעו בשלט. יש בערוץ 8 סדרת תעודה מרתקת על תל אביב עם מודי בראון בחליפה.

תבלו.

[פורסם לראשונה בבלוג הישן ב-19.10.2011, הפך למומלץ בישרא-בלוג והניתוחתקף גם היום, במלחמות, בבחירות ובחיי היום-יום.]

שחרור אסירים – שני הצדדים מנצחים

אחד מסוגי המשחקים הנפוצים ביותר בתורת המשחקים הם משחקי סכום-אפס. משחקים אלו מיוחדים בכך שסכום הרווחים של שני השחקנים הוא אפס. כל מה ששחקן אחד מרוויח השחקנית השניה מפסידה ולהפך, כל מה ששחקנית מרוויחה בא על חשבון השחקן.

דוגמא לכך הוא משחק הילדים הידוע "זוג או פרט". במשחק זה אחד השחקנים בוחר להיות "זוג" (כלומר, הוא בונה על תוצאה זוגית) והשחקן השני הופך ל"פרט" (ומקווה לתוצאה אי-זוגית). לאחר מכן כל אחד מהשחקנים בוחר מספר אצבעות והם חושפים את אצבעותיהם בו-זמנית. המנצח נקבע בהתאם לסך האצבעות שנחשפו. אם שני השחקנים ביחד הראו מספר זוגי של אצבעות, המנצח יהיה שחקן ה"זוג". אחרת, המנצח הוא שחקן ה"פרט". אם נעניק נקודה למנצח ונגרע נקודה ממאזנו של המפסיד נקבל משחק סכום-אפס. בכל שלב, שחקן אחד ירוויח נקודה ושחקן אחד יפסיד נקודה.

המייחד משחקי סכום-אפס ביחס למשחקים אחרים הוא העובדה שאין במשחקי סכום-אפס הזדמנויות לשיתוף פעולה. אין אף דרך בה השחקנים יכולים לשתף פעולה במשחק ולהרוויח יותר מאשר היו מרוויחים אם לא היו משתפים פעולה. דוגמא נוספת היא גמר גביע העולם בכדורגל. שתי הקבוצות המשחקות בו מעוניינות לנצח ולזכות בגביע. אין להן שום תמריץ לשתף פעולה. לעומת זאת, משחקי שלב הבתים באליפות גביע העולם אינם משחקי סכום-אפס. שם בהחלט ייתכן מצב שתוצאת תיקו יכולה להיטיב עם שתי הקבוצות ולכן הן לא יתאמצו יתר על המידה לנצח אלא יסכימו (בשתיקה) לבזבז את הזמן ולשחק על תיקו (תופעה מגונה בעולם הספורט, אך לא בכך עסקינן).

משא ומתן על שחרור מחבלים נתפס לעיתים רבות כמשחק סכום-אפס. ישראל אינה מעוניינת לשחרר מחבלים וכל מחבל שמשוחרר מהווה הפסד קטן לישראל. לעומת זאת, החמאס מעוניין לשחרר כמה שיותר מחבלים וכל אחד שלא משוחרר מהווה הפסד של החמאס. במקרה כזה, קל מאוד להתבצר בעמדות הראשוניות וקשה מאוד לרדת מהעץ ולוותר לצד השני. כל ויתור משמעותו הפסד לנו ורווח להם ולכן אין מקום לויתורים או פשרות.

בכדי לאפשר למשא ומתן להתקיים בכל זאת, יש להפוך אותו למשחק שאינו סכום-אפס. דרך אחת היא על ידי הוספת תמריץ חיצוני. למשל, בונוס כספי לשני הצדדים מגוף זר אחר (נניח, האמריקאים) תמורת סגירת העסקה. במקרה כזה, כדאי לצדדים לשתף פעולה ולהתגמש בכדי לסגור את העסקה ולקבל את הבונוס.

ברשומה זו אני מציע שיטה אחרת לשחרור מחבלים, שהופכת את המו"מ על שחרורם למשחק שאינו סכום-אפס. במקום לסגור על כמות המחבלים ואז להתווכח על זהותם, תהליך ארוך ומייגע ללא ספק, אני מציע שהמו"מ יהיה על שנות מאסר שיקוצצו. למשל, נחליט שמסכימים לוותר על 10,000 שנות מאסר. עכשיו הצד השני, החמאס, נדרש לבחור את האסירים אותם הוא רוצה לשחרר ובתנאי שסך זמן המאסר הנותר להם קטן מ-10,000 שנים. כך, למשל, החמאס יכול להחליט שהוא משחרר 2000 דגי רקק ואסירים "קלים" שלכל אחד נותרו רק 5 שנים להישאר בכלא או לחילופין למלא את הרשימה ברוצחים כבדים האסורים לתקופות ממושכות (כאשר מאסרי עולם, למשל, שקולים ל-50 שנים).

במצב כזה, לשני הצדדים יהיה בסופו של דבר הישג להתהדר בו. אם החמאס יבחר באפשרות הראשונה, ישראל תוכל להתגאות ששחררה רק פושעים קלים והחמאס יוכל להתגאות בכמויות. אם יבחר החמאס באפשרות השניה, ישראל תוכל להתגאות ששחררה רק מספר מועט של מחבלים והחמאס יתגאה באיכותם. באופן זה, שני הצדדים יוכלו להגיע להסכמה בקלות רבה יותר ועסקאות עתידיות יתממשו מהר יותר (מבלי להיכנס לדיון, האם בכלל יש לשחרר מחבלים או לשאת ולתת עם החמאס).

[פורסם לראשונה בבלוג הישן, ב-27.10.2011 כחלק מעיסקת שליט]