אשליית הגילוי

כלים וטכנולוגיות מאפשרים מחקרים חדשניים, אבל האתגר הגדול נותר: למנוע מההטיות האישיות שלנו להשפיע על התוצאות
X זמן קריאה משוער: 6 דקות

לכלים נודע מקום מרכזי בתולדות המדע, ובוודאי כשמדובר בחקר המוח ובפסיכולוגיה המדעית. במאה ה-19, תחום הפסיכולוגיה היה למדע אמפירי במלוא מובן המלה כאשר אימץ כלים מתחומי הנוירולוגיה והפיזיולוגיה. הכלים הללו סייעו באותם ימים למדוד שינויים בקצב הלב, לעצב ניסויים שמדדו זמני תגובה ולערוך תצפיות על התנהגותם של מטופלים עם פגיעות מוח. חוקרים נועזים יכלו אז להתחקות אחר הבסיס טבעי לקטגוריות מנטליות שמתארות סוגים שונים של ידיעה (מה שמכונה קוגניציה), תחושות (רגשות) ופעולה (רצוניות).

מאז אותם ימים ראשונים ומרגשים, מדע הפסיכולוגיה הועשר ללא הרף על ידי שילובם, פעם אחר פעם, של אביזרים ודרכי חישוב שיובאו מתחומי מחקר וידע אחרים. כשהתחלתי בקריירה שלי כחוקרת, ניסוח של מודלים שכללו משוואות היה צו השעה, מכשיר ה-fMRI עמד להופיע ותחום האופטו-גנטיקה אפילו לא היה קיים, ואילו רשת האינטרנט לא הייתה יותר מנצנוץ חיוור על צגים כבדים של 13 אינץ'. 25 שנה לאחר מכן, פלאות הטכנולוגיה הללו הם חלק מארגז הכלים הסטנדרטי שלנו. ועם התרחבות ארגז הכלים, מתרחבים גם הגבולות של מה שאנו מסוגלים לגלות.

כלים עשויים להעצים מבלי דעת את דעותיו המושרשות של החוקר, ממש כפי שהם מסוגלים לספק לו תגליות הנוגדות את האינטואיציה הבסיסית שלו

אלא שכדאי לזכור שכלים עלולים להסתיר, באותה הקלות שבה הם יכולים לגלות. למשל, בתחום המחקר שלנו רווחת קשת מגוונת של דעות באשר למהות השכל, הבינה, וכיצד הללו ממומשים על ידי המוח והגוף. בהקשר הזה, כלים עשויים להעצים מבלי דעת את דעותיו המושרשות של החוקר, ממש כפי שהם מסוגלים לספק לו תגליות הנוגדות את האינטואיציה הבסיסית שלו.

עדשה

העדשה היא תמיד חלק מהסיפור. תצלום: חקוב מחיקנוס

דוגמה מצוינת לכך היא אחת התוספות האחרונות לארגז הכלים של הפסיכולוג החוקר: למידת מכונה. משפחת הטכניקות רבת העוצמה הזאת מתחום האינטליגנציה המלאכותית, מאפשרת לנו לקבל החלטות ולהסיק מסקנות על ידי אימונו של מודל ממוחשב על פי קבוצה של תצפיות, וכך לזהות תבניות ולהכליל מהן לקבוצה חדשה של תצפיות. ההבטחה הגלומה בלמידת מכונה (ויש שיאמרו שבהתלהבות המוגזמת ממנה) טמונה בכך שהשיטה לכאורה אובייקטיבית, ומאפשר להוציא את המחשבה האנושית מהמשוואה המחקרית.

במובן הצר של המלה, למידת מכונה אינה עניין חדש בתכלית. ניתוח באמצעות רגרסיה הוא סוג פשוט של למידת מכונה המאפשר לנו להסיק מסקנות על סמך דוגמאות. למידת מכונה קיימת בתחום מדעי המחשב מזה שנים, והיא חלחלה לכל תחומי חיינו. מנועי חיפוש, למשל, משתמשים בלמידת מכונה כדי להשלים את השאלה שלכם מהר יותר ממה שאתם מסוגלים להקליד אותה, כיוון שעל סמך מיליארדים של חיפושים קודמים הם למדו לחזות בדיוק מצמרר מה אנשים מחפשים.

בדרך כלל, אנו מניחים שהמודלים שלנו מגלים דבר-מה אמיתי על העולם, על הטבע, משהו שאינו תלוי במחשבות ובאמונות שלנו

בפסיכולוגיה, אנו משתמשים בלמידת מכונה כדי לסווג תמונות, לזהות העדפות ולחפש סמנים ביולוגיים. בדרך כלל, אנו מניחים שהמודלים שלנו מגלים דבר-מה אמיתי על העולם, על הטבע, משהו שאינו תלוי במחשבות ובאמונות שלנו.

האמנם?

אראה לכם למה אני מתכוונת, באמצעות דוגמה קטנה.

נניח שאנחנו רוצים להבדיל בין העדפות: עוגה לעומת עוגיות. אולי תגידו שאין פה מקום להעדפה, ובמיוחד אם הן משוקולד, אבל תנו לי רגע לפתח את הרעיון. בשלב הראשון של המחקר הדמיוני שלנו, אנחנו משתמשים באינטואיציות שיש לנו ביחס לעוגות ולעוגיות כדי לאסוף אלפי תמונות של מאפים מפתים מתוך התוצאות של Google Images: עוגיות נימוחות עם שבבי שוקולד, פרוסות של עוגות שוקולד בחושות חמאתיות, עוגות שוקולד-גבינה מפוארות ועוד מטעמים. ליתר ביטחון, אנחנו מבקשים המוני משתתפים בניסוי לאשר את בחירת דימויי-הגירוי שלנו על ידי תיוג מפורש של כל תצלום: "עוגה" או "עוגייה".

בשלב השני, אנחנו מבקשים ממשתפים נוספים, רבים עוד יותר, לדרג את העוגות והעוגיות על פי המידה שבה הן מעוררות תיאבון, וזאת באמצעות שאלות כגון "האם הייתם נהנים לאכול את זה?", "כמה זה טעים?" וכו'. אנחנו משתמשים במיקור המונים לצורך התיוג, ונעזרים במערכת  Mechanical Turk של אמזון, כך שאיסוף הנתונים מושלם בתוך שבועות אחדים. לאחר מכן, אנחנו משתמשים בתשובות כדי לאמן אלגוריתם של למידת מכונה, תחת פיקוחנו, כך שהוא ידע לסווג: "אהבה לעוגות" לעומת "אהבה לעוגיות". אם אנו מצליחים, הרי שיש בידינו מערכת למידת מכונה שמבדילה בין שני רגשות שונים, וברמת דיוק גבוהה. משמעות הדבר היא שאנחנו יכולים להפעיל את המערכת שהתקבלה כדי לסווג דגימות חדשות. ואנחנו גם יכולים להפיק גרפים יפים, שמציגים את מקבצי הנתונים היפהפיים שלנו על פי קטגוריות המשקפות העדפה לעוגות או לעוגיות. אנחנו אפילו יכולים לסרוק את מוחותיהם של המשתתפים בעודם מציינים את העדפותיהם, להפעיל למידת מכונה כדי לגלות תבניות של פעילות מוחית – והופ, גילינו סמנים ביולוגיים ל"אהבת עוגה" ול"אהבת עוגיות".

אז איפה פה הבעיה?

לגישה האמפירית מהסוג הזה יש הרבה בעיות שהיינו יכולים לעסוק בהן, ללא ספק, אבל לצורך שלנו כאן נתמקד בבעיה אחת בלבד: מלכתחילה הנחנו שעוגיות ועוגות הן שתי קטגוריות נבדלות. ההנחה הזאת הנחתה אותנו בבחירת הגירויים, בעיצוב המחקר ובנתונים שאספנו. וראה זה הפלא, התוצאות של הניתוח שלנו באמצעות למידת מכונה מפוקחת עולות בקנה אחד עם שתי הקטגוריות שקבענו בתחילת הדרך. המחשבות שלנו, המונחות על ידי מוסכמות ושכל ישר, קודדו למודל למידת המכונה במהלך אימון המערכת.

מה היה קורה אם היינו דוגמים מגוון רחב יותר של מנות אחרונות? האם שתי הקטגוריות הללו היו עולות גם אז? אולי ההבחנה עוגה/עוגיות דומה יותר לרצף, שבו – למשל – עוגיית השוקולד הקלאסית מצויה בקצה אחד ועוגת השוקולד העשירה בקצה האחר? אבל מה לגבי בראוניז? האם הן עוגיות או עוגות? ומה עם חטיף עוגיות שוקולד מוארך? ומה עם עוגיית מדלן? מה עם דונטים זעירים או מקרונים מקוקוס? מה לגבי כל אלו?

מאפים, מתוקים, פירות, דונט'ס, עוגיות, עוגות

שאלת המחקר: האם אלו עוגיות? עוגות? Cupcakes? דונאטס? מנות אחרונות אחרות? תצלום: ברוק לארק

בדומה: מה היה קורה אילו נתנו לאלגוריתם למידת המכונה להסיק קטגוריות במקום להשתמש בתגיות "עוגה" ו"עוגיה" שאנחנו סיפקנו לו? הטכניקה הזאת ידועה כ"למידת מכונה בלתי מפוקחת". האם היינו מגלים אז קטגוריות נוספות, פרט ל"עוגה" ו"עוגיה", כמו "וניל", "ריבת חלב" או "כמיהה למנות אחרונות עם סלסולים" ו"כמיהה למנות אחרונות על משטחים בוהקים"? ויש לזכור שגם למידת מכונה בלתי מפוקחת אינה פתרון מושלם, כיוון שהיא יכולה לקבץ רק נתונים שאנחנו מזינים לתוכה.

מה לגבי כעס לעומת פחד? ראייה לעומת שמיעה? פרצפציה לעומת זיכרון? כאב עצבי לעומת כאב חברתי? זכר לעומת נקבה? הטיה בנתוני האימון היא רק אחת הבעיות שעלולות להוביל אותנו למה שנראה כתגליות על הטבע, על המוח והשכל האנושי, על ההתנהגות האנושית

המחקר שלנו, שלא לקח בחשבון שעוגות ועוגיות עשויות להימצא בהקשר, הניח שההעדפות הן קטגוריות קשיחות. אולי יש אנשים שמעדיפים עוגיות במהלך היום ועוגה בלילה? אולי יש מי שמסרבים למנה אחרונה כשהם שבעים, בעוד שאחרים זוללים שוקולד בכל מקרה?

כלים מתוחכמים אינם מגוננים עלינו מפני שילוב ההנחות שלנו על העולם, והכללת עצמנו בגירויים, בעיצוב הניסויים ובמסקנות התיאורטיות שאנו מסיקים. והדבר נכון במיוחד ביחס לכלים שנראים אובייקטיביים. העניין הזה עשוי להיראות מובן מאליו בניסוי הקטן והמצחיק שלנו הבוחן עוגות לעומת עוגיות, אבל מה לגבי כעס לעומת פחד? ראייה לעומת שמיעה? פרצפציה לעומת זיכרון? כאב עצבי לעומת כאב חברתי? זכר לעומת נקבה? הטיה בנתוני האימון היא רק אחת הבעיות שעלולות להוביל אותנו למה שנראה כתגליות על הטבע, על המוח והשכל האנושי, על ההתנהגות האנושית – כשלמעשה ה"תגליות" רק מאששות את האמונות שלנו. בפסיכולוגיה, הבעיה הגדולה, הכללית הזאת, מכונה "ריאליזם נאיבי", כלומר האמונה שהעולם הוא כפי שהוא נראה לנו. ב-1890 ויליאם ג'יימס כינה אותה "הכשל של הפסיכולוג". במדעי המחשב התפתחו תחומי מחקר שלמים, כמו אינטליגנציה מלאכותית אתית והוגנות בלמידת מכונה, כדי להתמודד עם הטיות מהסוג הזה.

כחוקרים בתחום הפסיכולוגיה, אנו יודעים להתגבר על ההטיות שלנו, ולמידת מכונה היא תחום נוסף שבו עלינו להתחזק ביכולותינו אלו.

וכך, כשאתם מקבלים כלי חדש למחקר, לפני שאתם מפעילים אותו ברוב התלהבות, קחו רגע וחשבו, פעם אחר פעם: מה שאנחנו רואים תלוי במידה רבה באופן שבו אנו מסתכלים.

ואז, כן, קחו לכם פרוסה של עוגת שוקולד. או עוגייה.

 

ליסה פלדמן בארט (Feldman Barrett) היא נשיאת ה-APS, האגודה למדע פסיכולוגי, ומשמשת פרופסור לפסיכולוגיה באוניברסיטת Northeastern וגם נושאת תפקידים בבית הספר לרפואה של הארוורד ובבית החולים Masachussetts General. פרופסור פלדמן בארט היא עמיתת גוגנהיים לשנת 2019.

המאמר פורסם במקור ב-Association for Psychological Science. כל הזכויות שמורות לאלכסון.

תרגם במיוחד לאלכסון: אדם הררי

תמונה ראשית: עוגיות שוקולד. תצלום: דונלד מודסט, unsplash.com

Photo by donald modeste on Unsplash

מחשבה זו התפרסמה באלכסון ב על־ידי ליסה פלדמן בארט, APS Observer.


תגובות פייסבוק