מדען אורח ד"ר קובי גל

המחשבים הלומדים מתי לא להפריע לנו או אלה שיודעים לנבא את מהימנותו של הצד השני במשא ומתן. עתיד הבינה המלאכותית לא יחליף את האדם במחשב, אלא ייצור ביניהם שיתוף פעולה פורה
X זמן קריאה משוער: 10 דקות

מהי, לדעתך, פריצת הדרך המשמעותית או המסקרנת ביותר שנעשתה בתחום המחקר שלך בשנים האחרונות?

למרות התקדמות הטכנולוגיה ישנם עדין סוגים רבים של בעיות שלבני אדם יש יתרון על מחשבים, בעיקר משום שלא קיים אלגוריתם ידוע לפתרון הבעיה (כגון פענוח שפה טבעית, תיוג תמונות באינטרנט, ובעיות שפתרונן דורש מה שאנו נוהגים לכנות ״יצירתיות״). לכן, פריצת דרך מלהיבה במדעי המחשב היא התחום "חישוב אנושי" (human computation), המשתמש בכוח החישוב האנושי כדי לפתור בעיות שלא ניתן לפתור באמצעות כח חישוב גרידא. התחום הפך על פיו את המודל השגור, לפיו אדם מזין בעיה מוגדרת היטב לתוך המחשב כדי לקבל ממנו פתרון לבעיה. הרעיון ב"חישוב אנושי" הוא שהמחשב הוא זה שמחלק בעיות לאנשים לפתור ביחידים או בקבוצות, אוסף את התוצאות ומרכיב מהן פתרון אופטימלי לבעיה.

אפשר לקחת בתור דוגמה את שיטה הנקראת captcha, שפותחה על ידי לואיס וון אן מאוניברסיטת קרנגי מלון שבפיטסבורג. captcha מוכרת לכל מי שאי פעם נדרש להקליד רשימת אותיות ומספרים המוצגת באופן מעוות כאשר ביצע פעולות כמו תשלום בכרטיס אשראי או הרשמה לאתר או שירות כלשהו כמו תיבת מייל. רובנו מסיקים בצדק, כי המטרה היא לוודא כי מי שמבצע את הפעולה הוא אדם, משום שלא קיים סורק ממוכן שיכול לקרוא את הרשימות הללו. אך ישנה מטרה נוספת והיא קידוד דיגיטלי של טקסטים קשים לפענוח על ידי מחשב, כגון ספרים ועיתונים עתיקים. למעשה, כל captcha מורכבת משתי מילים: הקידוד של המילה הראשונה ידוע כבר והיא משמשת לביקורת ולווידוא שהמשתמש אינו מזין סתם אותיות. המילה השניה נלקחה מטקסט קשה לפיענוח והקידוד שלה על ידי המשתמש נאגר בבסיס נתונים. לאחר שנאספו אלפי קידודים לכל אחת מהמילים הלא ידועות, המחשב מכריע, בהסתמך על אלגוריתמים סטטיסטיים, מה הקידוד הכי מתאים לכל אחת מהמילים הלא ידועות. עיתון הניו יורק טיימס הצליח לקודד דיגיטלית בצורה זו במספר שבועות את כל מצבור העיתונים שלו שיצאו לפני שנת 1900. הדיוק של הקידוד היה מושלם, גבוה בהרבה מהתוצאה שהיתה מתקבלת על ידי צוות מקודדים גדול ויקר של שכירים, שגם היה לוקח לו הרבה יותר זמן.

דוגמא נוספת היא משימה שקל לאמן גולשים לבצעה במהירות, והיא מיון של תצלומי גלקסיות בחלל שיש לסווגם לפי תכונות כגון צורה ובהירות. באופן זה, 150,000 אנשים סיווגו למעלה מחמישים מיליון גלקסיות במשך שנה בלבד, באמצעות אתר ייעודי בשם galaxyzoo. כל גולש קיבל תשלום נמוך (מספר סנטים) על סיווג כל תצלום. ברקע פעל אלגוריתם מתוחכם שחישב את כמות האנשים שצריכים לסווג כל תמונה כדי להבטיח דיוק מספיק גבוה של סיווג בכמה שפחות כסף. דוגמאות רבות נוספות ניתן למצוא החל מפתרון בעיות בביולוגיה ועד חקר קבלת החלטות בקבוצה וניסוים בפסיכולוגיה שמתבצעים על אלפי אנשים ברחבי העולם. הדוגמאות הללו מראות כיצד אלגוריתמים מצליחים להפוך חוכמת המונים לכוח חישוב נטו ולפתור באמצעותו בעיות קשות.

מהם המחקרים שמעסיקים אותך בתקופה זו?

עמיתי ואני מנסים להביא מהפיכה טכנולוגית אמיתית בחינוך באמצעות הבינה המלאכותית. המחקרים שלי משתמשים ביכולת של המחשבים להשלים (לא להחליף!) את המורה, כדי ליצור סביבה לימודית עשירה לתלמיד ומשוב יעיל למורה.
אחד המחקרים שלי מנתח בצורה אינטליגנטית כיצד תלמידים משתמשים במעבדות וירטואליות. מעבדה וירטואלית היא תוכנת סימולטור המדמה תנאי מעבדה ממשיים ומאפשרת לתלמידים לבנות ולהריץ מודלים שונים ולנתח את תוצאותיהם. במעבדה וירטואלית לכימיה, למשל, התוכנה מאפשרת להם לערבב בין חומרים, להפעיל מבער לטמפרטורה רצויה ולמדוד תגובות כימיות שנוצרות כתוצאה מהפעולות שלהם. במעבדה לסטטיסטיקה והסתברות, הם יכולים להריץ סימולציה של זריקת קובייה ולבחון תוצאות הסתברותיות. אפשר היה לגרום להם לשנן את הנוסחה לפתרון הבעיות אך המשחק וההתנסות שנוצרים בסימולציה של ניסוי אמפירי הם מרחב פעולה המאפשר חקירה, וניסוי וטעיה. כל אלה מעמיקים את ההבנה של התלמיד בדרך לפתרון, כפי שהראו מחקרים רבים.

מעבדות וירטואליות הופכות להיות נפוצות במוסדות חינוכיים ברחבי העולם, אך לצד התועלות הרבות, הן יוצרות קושי אמיתי למורים ולחוקרי חינוך המבקשים להבין ולנתח את יכולות התלמידים. איך לדוגמא יוכל המורה לדעת אילו מהתלמידים הצליחו להשלים משימות בזמן סביר, אילו מהילדים מתקשים בפתרון וזקוקים להדרכה אישית, ומיהם ה"גאונים" שחשוב לאפשר להם להתקדם לשאלות מורכבות יותר? כאן בדיוק נכנסת הטכנולוגיה שפיתחתי, בה משתמשים כיום באוניברסיטאות בארה"ב ובארץ. קיבלתי לידי בסיסי נתונים ובהם מאות אלפי רשומות של סטודנטים ותלמידים מכל העולם שהשתמשו במעבדות וירטואליות. הסטודנטים שלי ואני פיתחנו אלגוריתם שלמעשה מתפקד כ"זבוב על הקיר" בכך שהוא מאפשר להציץ בפעולות התלמיד, להסיק את דרך עבודתו, לגלות היכן הקשיים, לאבחן אסטרטגיות לפתרון ולאתר טעויות. לאחר מכן, פיתחנו שיטות להצגת מידע זה למורים, על מנת לאפשר להם ניתוח מהיר אך מעמיק של דרך העבודה והקשיים של תלמידיהם.

בפרויקט אחר, אנחנו מפתחים סוכן ממוחשב שלומד מתי "להפריע" למשתמש עם מידע מועיל ומתי לא. סוכנים חכמים שנועדו ללמוד את דפוסי השימוש שלנו ולסייע בהתאם, כמו למשל google now, עשויים לנוע בין שני קטבים: בצד האחד של הסקאלה, אפשר לדמיין סוכן שמטריד אותנו כל שניה עם מידע אודות מזג האוויר, זמן הגעה הביתה והצעות למבצעים ותכנים שהוא "משוכנע" שנמצא בהם עניין על סמך דפוסי השימוש שלנו. במקרה כזה, מרוב הסחות דעת, כנראה שמרוב בהלה נוציא את הסוללה כדי להשתיק את המכשיר. בקצה השני של הסקאלה, הסוכן יציע הצעות רק כאשר נשאל אותו שאלות ספציפיות. אך גם כאן יש בעיה כי לא תמיד אנחנו יודעים מה לשאול ומתי. עכשיו, נניח שיש סוכן חכם שיודע לא רק לנבא את הצרכים ותחומי העניין שלנו, אלא גם לדעת מתי לא לעשות זאת, מתוך התחשבות באופן בו ההפרעה משפיעה עלינו.

לשם כך הרצנו ניסוי, במסגרת פרויקט בשיתוף אוניברסיטת הרווארד וחטיבת המחקר של חברת מיקרוסופט, בו ניסינו להבין מתי התערבות המחשב מסייעת לנבדקים ומתי היא הסחת דעת בלתי רצויה. לדוגמה, גילינו שכאשר האדם נמצא קרוב למטרה אליה הוא רוצה להגיע (נניח שהוא בנסיעה ורוצה להגיע הביתה להכין פסטה), כך הוא ייטה יותר לדחות את הצעותיו של המחשב (לעצור במכולת, למשל, כדי לקנות עגבניות שהמחשב יודע שחסר בבית). השאיפה של המוצר המוגמר היא לתזמן את ההפרעות בצורה שהאינפורמציה המועילה תגיע למשתמש, אך במינימום הפרעה לקשב שלו ולמהלך עבודתו.

כיצד אתה רואה את העתיד של תחום המחקר שלך?

עתיד הבינה המלכותית טמון בהכרה ההולכת וגוברת כי מחשבים לא יוכלו להפגין אינטליגנציה אמיתית ללא התחשבות בגורם האנושי איתו הם מתקשרים. בעבר ראו מדענים את הבינה המלאכותית כממשיכה ישירה של המהפכה התעשייתית. כפי שזו פיתחה יכולות ממוכנות שהחליפו את הצורך בעבודה פיזית אנושית, כך סברו כי הבינה המלאכותית תוביל למחשבים אינטליגנטיים שיוכלו להשתוות בביצועים שלהם למומחים האנושיים הכי חזקים, בכל תחום אפשרי, ולפיכך יוכלו להחליף מורים, נהגים, שופטים ועוד. לאחרונה גוברת ההבנה כי יש הרבה בעיות פתוחות בבינה מלאכותית שלא ניתן לפתור ב"כוח הזרוע" – יכולת חישוב גרידא – אלא שדרושה גם הבנה של תהליכים פסיכולוגיים, חברתיים ותרבותיים, מהם התעלמו מדענים במשך זמן רב.

העתיד של הבינה מלאכותית טמון בהכרה שתוכנות מחשב אינן יכולות להוות תחליף אמיתי ומלא לבני אדם. אני סבור שהכיוון העתידי הנכון בתחום הזה הוא מערכות המבינות כיצד לשתף פעולה עם המשתמשים האנושים שלהם, ולא מנסות ״לנצח״ או להחליף אותם. כאן טמון פוטנציאל ליצור שלם הגדול מסך חלקיו, משום שמחשבים מצטיינים בפעולות מסוימות יותר מבני אדם ובפעולות אחרות להיפך.
לדוגמא, במחקר משותף עם פרופ׳ שרית קראוס מאוניברסיטת בר אילן בנינו מחשב שיידע לנבא את מהימנותם של בני אדם בעת משא ומתן בתרבויות שונות. המחקר מבוסס על משחק משא ומתן שמשחקים אותו לאורך זמן, שבו הצדדים מגיעים להסכם ומחליפים משאבים ביניהם. המחשב מנסה לנבא את מהימנות הצד השני (האנושי) במשא ומתן, על סמך תצפיות עבר בפעולותיו הקודמות ובעיקר על סמך אנשים דומים לו בסיטואציית משא ומתן דומה.

ישנם מדדים רבים הנלקחים בחשבון. מידת הנדיבות של ההצעה שמביא הצד השני ובאיזה שלב היא הובאה למשא ומתן, הגיל של הנושא ונותן, הלאום, המצב הסוציואקונומי, המגדר – המחשב משתמש בכל אלה ועוד כדי להעריך על בסיס תוצאות עבר, עד כמה אדם המתאים לפרופיל מסוים בסיטואציה דומה ייטה להיות מהימן ולקיים את הבטחותיו. כך, לדוגמא, הצליח המחשב ללמוד שבמדינות ערב אנשים פחות נדיבים במו"מ ממדינות המערב ואולם, משנחתם הסכם, אנשים במדינות ערב הרבה יותר מהימנים.

באופן היפותטי, ייתכן כי הצבת מחשבים במקום בני אדם מכל צד היתה מייתרת את המשא ומתן מלכתחילה, משום שהמחשבים היו מגיעים לפתרון הרציונאלי האופטימאלי והמאוזן ביותר. אך בני אדם הם אלה שצריכים בסופו של דבר להוציא לפועל את ההחלטות וכאן אנחנו תמיד רואים שנכנסים שיקולים אמוציונליים, תרבותיים וכולי. לכן הכלי שתיארתי לעולם לא יוכל להחליף בני אדם ולייתר את המשא ומתן, אך הוא עשוי להכניס אינפורמציה מועילה שתהפוך את התהליך למאוזן יותר.

מהו הסבר אלגנטי, עמוק או יפה בעיניך לתופעה כלשהי?

לפני כעשר שנים האנתרופולוג ג׳ו הנריק בדק התנהגות במשא ומתן בשבט אפריקאי וגילה כי נבדקים נוהגים להציע הצעות מאוד לא נדיבות במשא ומתן ואף מסכימים לקבל הצעות לא נדיבות מאחרים. הממצא נגד תוצאות מחקרים רבים שנערכו לאורך שנים, לפיהם עולה המסקנה הנחרצת כי בני אדם מצפים להוגנות ולחלוקה שווה של ״העוגה״ בעת משא ומתן. התוצאות המנוגדות של הנריק הן רק קצה הקרחון. בשחזור ניסויים במגוון תחומים בפסיכולוגיה באזורים שונים בעולם, התגלו תוצאות שונות מאלה שהתגלו במעבדה וזאת, למרבה הפלא, גם כאשר היה מדובר בתחומים הנחשבים לאוניברסאליים ולא תלויי תרבות (כמו בתחום האשליות התפיסתיות). ההסבר לכך הוא הפלח הצר של אוכלוסיית הנבדקים שעליה מבוססים רוב הניסויים בפסיכולוגיה: סטודנטים מאוניברסיטאות יוקרתיות במדינות מערביות. הסבר זה אינו מפתיע ולמעשה יש על הנושא הזה ביקורת שנים רבות. באנגלית אוכלוסיית נבדקים זו אף "זכתה" לראשי התיבות WEIRD (מוזרים): Western, Educated, from Industrialized, Rich Democratic countries. אבל אני חושב שמעניין יותר מההסבר, הוא הניסיון להתגבר על הבעיה באמצעות כלים חדשים. מצד אחד, השאיפה היא עדיין להבין אילו תוצאות ניתן להכליל ואילו תלויות תרבות, אך מצד שני, לא ריאלי לערוך כל ניסוי ברחבי העולם. כאן נכנסת לתמונה האפשרות לערוך מגוון עצום של ניסויים בעולם באמצעות תוכנות מתאימות וחיבור לאינטרנט. אלה ניסויים שצריך להשקיע מחשבה רבה בתכנונם אך זול יותר להריץ אותם וניתן להגיע באמצעותם למסקנות בקנה מידה אוניברסאלי.

לגבי מה אתה אופטימי?

הטכנולוגיה ומהפיכת המידע שינו את הדרך בה אנשים מתקשרים אחד עם השני, עובדים, קונים, נוהגים, ומבלים. לעומת זאת, הטכנולוגיה עדיין לא הצליחה להביא מהפיכה בתחום החינוך. רובן הגדול של התוכניות החינוכיות אינן אדפטיביות לצרכי התלמיד, בודקות את הציון שלו ולא את הידע וההבנה שהוא רכש, ובאופן אירוני, הן מייצרות עבודה שחורה למורים במקום לסייע להם להתייעל. ועם זאת, כבר היום אנחנו מתחילים לראות מגמות טכנולוגיות שאני אופטימי שייצברו תאוצה וישנו את האופן בו מוסדות הלימוד פועלים.

ממצאים רבים במחקר חינוכי מראים, למשל, את יתרונותיה של הלמידה בצוותים על פני למידה אינדיבידואלית (יתרונות כמו העמקת ההבנה, השחזת החוש הביקורתי ופיתוח רעיונות חדשים). המפתח למקסם את יתרונות הלמידה בקבוצה טמון בפתרונות טכנולוגיים. בשיטה של פרופ׳ אריק מזור מאוניברסיטת הרווארד, למשל, הנקראת peer instruction, המורה אינו מכתיב את החומר אלא בעיקר שואל שאלות בכיתה. הסטודנטים מרכיבים צוותי חשיבה ומצביעים על התשובה הנכונה באמצעות הטלפון. המרצה מקבל ניתוח ומפעיל אלגוריתם המצוות את הסטודנטים מחדש, כדי שלא יישארו צוותים הומוגניים מדי (החלשים עם החלשים והחזקים עם החזקים).

כל שיטת הבחינות צריכה גם היא לעבור שינוי דרסטי. כיום אנשי החינוך שמחברים את השאלות הם גם אלה שקובעים את דרגת הקושי של כל שאלה, ולרוב זה גם מה שמכתיב כיצד להרכיב את המבחן הסטנדרטי של הכיתה. אבל באחד המחקרים שעשינו גילינו שפעמים רבות השאלות הנחשבות קשות, היו דווקא קלות לתלמידים ולהיפך. בכלל, אם אנחנו שואפים שמבחנים יסייעו לתלמידים לפתור שאלות קשות יותר ויותר, אז מה הטעם בקיום מבחן סטנדרטי לכולם. ברור שזקוקים למבחנים סטנדרטיים כדי לייצר תנאי מעבר, אך במקרים בהם מבחן הוא כלי פדגוגי (וכאלה הם רוב המבחנים), עלינו להתאים אותם באופן אינדיבידואלי לילדים.

הסטודנטים שלי ואני מנסים להתאים שאלות לתלמידים על סמך עקרונות הביג דאטה. האלגוריתמים שפיתחנו מייצרים פרופילים של שאלות לתלמידים על ידי ניתוח רב ממדי של ביצועיהם של עשרות אלפי תלמידים שענו על שאלות בעבר. המחשב לוקח בחשבון לא רק את הציונים, אלא גם את זמן הפתרון של כל שאלה, מספר הניסיונות, וקצב השיפור של התלמידים, והכל בצורה אנונימית לגמרי. בצורה כזו יכולים מחשבים לקבוע באופן אובייקטיבי את דרגת הקושי של כל שאלה ובמקביל, גם לייצר פרופילים של תלמידים ברמות שונות. כך, כשתלמיד ניגש למבחן, לאחר מספר שאלות התחלתיות שנועדו לסווגו לפרופיל המתאים, המחשב יתאים עבורו מבחן שיאתגר אותו ברמה האופטימאלית.

אני חושב שהרוב מכירים בכך ששיטת החינוך כיום היא אנכרוניסטית ברובה, בדגש שהיא שמה בעיקר על שינון וציונים. השאלה הנשאלת היא, כיצד לשנות את המערכת הזו וברוב המקרים, לצערי, הפתרון האינטואיטיבי שעולה הוא "עוד": עוד כסף, עוד מורים, עוד כיתות מרווחות, עוד טאבלטים וכולי. אבל אני חושב שהתשובה טמונה בשינוי הגישה ובהטמעת הכלים הטכנולוגיים הנכונים ואני מאמין שבמוקדם או מאוחר זה יחלחל גם אצל מקבלי ההחלטות.

מחשבה זו התפרסמה באלכסון ב

תגובות פייסבוק

תגובה אחת על ד"ר קובי גל

01
מחשביקו

אני חולק על האמירה "עתיד הבינה המלכותית טמון בהכרה ההולכת וגוברת כי מחשבים לא יוכלו להפגין אינטליגנציה אמיתית ללא התחשבות בגורם האנושי איתו הם מתקשרים."

לדעתי תוך 20 שנה מהיום יהיו לנו מחשבים חכמים יותר מבני אדם. כמובן שכולנו יודעים למי ניתנה הנבואה...

דר קובי, האם אתה מכיר את הפרויקט הזה:

http://deeplearning.net/2012/12/13/googles-large-scale-deep-learning-experiments/