חכו קצת, זה עוד ישתלם

גם לאחר הגילוי כי האסטרטגיה היעילה ביותר היא נצלנית במהותה, הנדיבות עדיין משתלמת
X זמן קריאה משוער: 4 דקות

מאז דרווין, ביולוגים תמהים מדוע יש כל כך הרבה עדויות בטבע לשיתוף פעולה, לנדיבות ולאלטרואיזם, כאשר ההנחה הבסיסית היא שטבעו האנוכי של כל אורגניזם הינו לשרוד ולמקסם את רווחתו האישית. התמיהה התחדדה עם ניסוח דילמת האסיר בשנת 1950. במצב בו שני שחקנים מתחרים על גמול מסוים (טריטוריה, כסף, פחות שנים בכלא...) עומדות בפני כל אחד מהם, לכאורה, שתי אפשרויות: לשתף פעולה עם השני או לבגוד בו. ההסתייגות במילה "לכאורה", היא בשל הפרדוקס הטמון בדילמה. אם השחקן השני בוחר לבגוד, אזי משתלם לבגוד בו גם כן; כך שני השחקנים יוצאים בשן ועין אך עם רווח מינימלי. ואם, לחילופין, השחקן השני בוחר לשתף פעולה, אז על אחת כמה וכמה משתלם לבגוד בו ולגרוף את כל הקופה. שיתוף פעולה הדדי היה מוביל לחלוקת הגמול בין השחקנים והפרדוקס נובע מהעובדה שהפעולה הרציונלית עבור כל אחד מהם בנפרד, תוביל בהכרח להפסד קולקטיבי.

דילמת האסיר הופכת למעניינת ורלוונטית במיוחד, כאשר בוחנים את תוצאותיה על פני סדרת משחקים חוזרים. הזיכרון כיצד נהג היריב בסיבובים הקודמים, מאפשר לכל שחקן לגבש אסטרטגיה לסיבובים הבאים. כאן דילמת האסיר נעשית דומה יותר לחיים האמיתיים, למשל בהתפתחותם האבולוציונית של מינים, במרוץ חימוש בין מדינות אויבות, בהתנהגותן הכלכלית של חברות מתחרות ועוד. במשך למעלה משישים שנה, האסטרטגיה המנצחת היתה "מידה כנגד מידה"- לפתוח בשיתוף פעולה ובכל סבב נוסף לחקות את פעולתו של היריב בסיבוב הקודם. כאשר מריצים בסימולציית מחשב שלל אסטרטגיות במשך מאות עד מיליוני משחקים חוזרים, "מידה כנגד מידה" מוכחת כאסטרטגיה הרווחית מכולן בשל המצב השוויוני הנוקשה שהיא מכתיבה. עולה ממנה גם מסר מנחם, כיוון שהיא מראה שאפשר לאלץ את היריב להבין שבטווח הרחוק שיתוף פעולה הדדי הוא הכי משתלם.

לאחר שישים שנה בהן "מידה כנגד מידה" שלטה בכיפה, הורגלנו להאמין כי האסטרטגיה הרווחית ביותר היא תמיד "win-win", כלומר, כשכל צד מאפשר לשני להרוויח כמותו. אבל באפריל 2012 נפל דבר בתחום תורת המשחקים כאשר שני חוקרים ידועי שם, וויליאם פְרֵס ופרימן דייסון, הוכיחו מתמטית כי קיים סוג אסטרטגיות רווחי יותר המבוסס על ניצול, אשר הרצתו מול שאר האסטרטגיות במשחקים חוזרים, מניב רווחיות גבוהה מזו של "מידה כנגד מידה". המחקר עורר תדהמה, שהובעה מאז במאמרי תגובה בעשרות כתבי עת מקצועיים ופופולאריים, וכמו רוב הרעיונות הגדולים, גם המסקנות של פרס ודייסון נתקלו בתגובות בסגנון: איך אף אחד לא ראה זאת קודם.

צמד החוקרים יצא מתוך נקודת הנחה שכל אורגניזם הוא "שחקן אבולוציוני" ששואף למקסם את רווחתו האישית. מתי שאיפה זו הופכת לנקודת תורפה? כאשר משתמשים באסטרטגיה שמסוגלת "לאלף" את השחקן האבולוציוני לשתף פעולה במידה מוגדרת מראש. אסטרטגיית אילוף זו מגולמת במשוואות שמצאו פרס ודייסון, בהן צריך רק להזין עד כמה ברצונך לנצל את השחקן השני. זה נשמע מופרך (למה שהצד השני ייתן שישלטו בו כך?), עד שנזכרים שזה מה שמצליחה לעשות אסטרטגיית "מידה כנגד מידה" שהיא, כך מתברר, מקרה ספציפי של האסטרטגיות של פרס ודייסון. "מידה כנגד מידה" מאלפת את היריב לשתף פעולה תוך שמירה על מצב מאוזן של הרווחים והפסדים. אך החוקרים הראו כי "מצב מאוזן" איננו האפשרות היחידה וכי ניתן ליצור עבור היריב תקרת זכוכית: רף רווחים אליו הוא ישאף להגיע, אך כזה שיהיה נמוך יותר בהפרש קבוע. זה עובד כל עוד היריב אינו קולט שהציבו לו תקרת זכוכית וכאשר זה עובד, נוצר אי-שוויון חברתי מובנה.

מאז שפרס ודייסון פרסמו את מאמרם, ניסו חוקרים להבין מה קורה כאשר האסטרטגיות הנצלניות והרווחיות הללו פועלות באוכלוסייה, ומה קורה כאשר מתעוררת בקרב שחקנים מסוימים המודעות כי הם מנוצלים לרעה. בראיון למגזין Edge, פרס כתב כי יהיה זה חבל אם תוצאות מחקרו ישמשו כדי להעלות על נס את רדיפת הבצע כאופציה המשתלמת. לטענתו, מודעות שני הצדדים לאסטרטגיית תקרת הזכוכית שהוא ודייסון גילו, עשויה גם להניב ברית משתלמת, תוך הגדלת שיתוף הפעולה למקסימום האפשרי לשני הצדדים.

במילים אחרות, כאשר מתעוררת מודעות לניצול, אסטרטגיית תקרת הזכוכית עשויה להפוך להיות אסטרטגיה נדיבה. זה נשמע מאוד אופטימי אך מצד שני, רוב השחקנים אינם מתוחכמים דיים כדי לזהות את הניצול ולהציב בעצמם תקרת זכוכית ליריב ומכאן, הגיוני לשער כי ניצולם יימשך ואולי אף יתרחב לשחקנים נצלנים נוספים. שכן מחקרים בעבר הראו כי גם לאסטרטגיות אנוכיות יש נטיה לשכפל את עצמן באוכלוסייה, וזאת יודע כל ישראלי שהחליט "לא לצאת פראייר" במנטליות שבה, לתחושתו, "כולם דופקים את כולם". אז שאלת השאלות היא, מה קורה כאשר מצרפים את האסטרטגיות לסלט אחד גדול ובוחנים אותן לטווח רחוק. זה בדיוק מה שעשה מחקר שהתפרסם שבוע שעבר בכתב העת PNAS.

אלכסנדר סטיוארט וג'ושוע פלוטקין מאוניברסיטת פנסילבניה הכניסו לסימולציית מחשב מגוון אסטרטגיות, כולל את אלה של פרס ודייסון המציבות תקרת זכוכית ליריב, בין אם מתוך עמדת ניצול ובין אם מתוך עמדת נדיבות. לאורך דורות רבים של משחקים, עולה כי האסטרטגיות שהתגלו כרווחיות ביותר ושוכפלו לשאר האוכלוסייה יותר מכולן, היו באופן מובהק אלה שגילו נדיבות ושיתוף פעולה. "המחקר שלנו מראה כי שום אסטרטגיה אנוכית אינה זוכה להצלחה בטווח הרחוק", אומר פלוטקין, "האסטרטגיות האיתנות היחידות מבחינה אבולוציונית הן אלה הנדיבות".

מקורותהמחקר של פרס ופרימן בכתב-העת PNAS על האסטרטגיה המנצחת במשחק חוזר של דילמת האסירמאמר המסביר את משוואותיהם וממצאיהם של פרס ופרימןשאלות ותשובות עם וויליאם פרס באתר Edgeהמחקר של סטיוארט ופלוטקין בכתב-העת PNAS על ניצחונה של הנדיבות באסטרטגיות בדילמת האסירכתבה על מחקרם של סטיוארט ופלוטקין באתר Science Daily

מחשבה זו התפרסמה באלכסון ב


תגובות פייסבוק

> הוספת תגובה

4 תגובות על חכו קצת, זה עוד ישתלם

02
אופטימיסטאן

מרתק!
רצוי מאד שי"נ הררי יעיין בדברים הללו, ויוציא מהדורה מתוקנת של ספרו, אשר תציג באופן הגון את האבולוציה, ולא רק את צדדיה האגוצנטריים

04
יוס

תודה על המאמר! מרתק

ועדיין, למרות ש'...שום אסטרטגיה אנוכית אינה זוכה להצלחה בטווח הרחוק', האדם ממשיך להראות נטיות אנוכיות ברוב מעשיו, ולא מצמית מהשורש כל נטיה כזו.

למעשה, יש לנו חשש מפני חברה שהיא כולה אנטי-אנוכית, כמו המודל הקומוניסטי (או האנארכי). מדוע זה? שאלות טובות. מקוה שמישהו מחפש תשובות...