ילדים והיצירתיות שלהם הם המפתחות האמיתיים והמבטיחים ביותר להבנת האינטליגנציה
X זמן קריאה משוער: 9 דקות
לאחרונה, אחת החוקרות במעבדת המחקר של אוניברסיטת ברקלי לנושא הבינה המלאכותית, יצאה עם בנה בן הארבע לטיול בקמפוס. הילד הביט במגדל הפעמונים שבראשו השעון המפורסם וקרא בהפתעה והשתוממות, ״יש שם למעלה-למעלה שעון!״. כעבור מספר דקות הוא הסביר, מהורהר, ״אני משער שהם שמו את השעון שם כדי שילדים לא יגיעו אליו ולא ישברו אותו״. לכל מי שיש להם ילדים בני ארבע יש סיפורים דומים על יצירתיות בגיל טרום בית הספר – מחשבות בלתי צפויות ומקסימות על העולם והמסתורין שבו, שיש בהן היגיון משלהן.
ההבדל בין הילד היצירתי בן הארבע ובין הבינה המלאכותית הצפויה עשוי להיות אחד המפתחות להבנת האופן שבו פועלת האינטליגנציה האנושית והאינטראקציות שעשויות להיות לה עם בינה מלאכותית
אם נשאל מודל בינה מלאכותית מסוג Large Language [תוכנה שמסוגלת לקרוא, לסכם, לתרגם טקסטים ולצפות מילים במשפט וכך לייצר משפטים דומים לאלה שבשפה הטבעית] את אותה שאלה: למה ישנו שעון בראש המגדל? נקבל תשובה הרבה יוצר צפויה והרבה פחות מעניינת. GPT-3, אחד המודלים היותר מרשימים בתחום, המבוסס על מיליוני מילים מתוך טקסטים, נותן תשובה הגיונית למדי, ״יש שעון בראש מגדל הפעמונים משום שזהו שעון של מגדל פעמונים״ או ״השעון בראש המגדל נמצא שם כדי להורות את השעה״. למעשה, המודלים האלה אמורים להיות צפויים. כדי לאמן אותם מציגים להם מילים ספורות מתוך טקסט והם מתבקשים לצפות את המילים הבאות במיליארד מקרים. ההבדל בין הילד היצירתי בן הארבע ובין הבינה המלאכותית הצפויה עשוי להיות אחד המפתחות להבנת האופן שבו פועלת האינטליגנציה האנושית והאינטראקציות שעשויות להיות לה עם בינה מלאכותית. לפסיכולוגיה, ובעיקר לפסיכולוגיית ילדים, יהיה תפקיד מכריע ביצירה ושימוש של טכנולוגיה עתידית.
בתחילה, אנו עשויים לחשוב שלא הולם להשוות ילד בן ארבע לבינה מלאכותית משוכללת. הרי ברור שעולם ילדי הגן, המלא בצבעי אצבעות, דובוני פרווה ומסיבות תה דמיוניות הוא הדבר הכי רחוק מהעולם של עמק הסיליקון ומשקיעי הון סיכון, חברות סטרטאפ ואלגוריתמים של למידת מכונה (אף שלשתי הקבוצות יש חיבה בלתי הגיונית לחדי קרן). והרי ברור שהמכונות החזקות והיקרות הללו יאפילו בכל סוג של מטלה על ילדים קטנים, אפילו אם אינן מסוגלות עדיין להתחרות עם מבוגרים.
'במקום לנסות ליצור תוכנה שתחקה את המחשבה הבוגרת, למה לא לנסות ליצור תוכנה שתחקה מחשבה של ילדים?' - אלן טיורינג (1959)
אבל אי אז, בשנת 1959, אלן טיורינג, שהמציא את המחשב המודרני, חשב שילדים עשויים להיות המודל הטוב ביותר לבינה מלאכותית תבונית באמת. במאמרן Computing Machinery and Intelligence, הוא הציג את ״מבחן טיורינג״ המפורסם. אם מחשב מסוגל לחקות באורח משכנע שיחה בין מבוגרים, נהיה חייבים להשלים עם כך שהוא תבוני. אבל אף שכולם מכירים את מבחן החיקוי, מעטים שמים לב לפסקה הבאה: ״במקום לנסות ליצור תוכנה שתחקה את המחשבה הבוגרת, למה לא לנסות ליצור תוכנה שתחקה מחשבה של ילדים?״ טיורינג התכוון לומר שגם אם מבוגרים ניחנו בידע מסוים והם משתמשים בו, ילדים ממש בונים את הידע הזה על סמך ניסיונם. סוג כזה של למידה עשוי להיות המפתח האמיתי. לאינטליגנציה.
למעשה, בשנים האחרונות, חוקרי בינה מלאכותית פנו לפסיכולוגים התפתחותיים כדי להבין את סוג האינטליגנציה שמאפשרת לנו ללמוד כל כך הרבה. לרעיון הזה ישנם שורשים ארוכים בתחום מדעי המוח. מודלים של רשתות עצביות משנות ה-80 ומודלים בייסיאניים גנרטיביים של שנות האלפיים שימשו השראה לשיתופי פעולה בין פסיכולוגים התפתחותיים ומדעני מחשב. אבל ״האביב של התבונה המלאכותית״ הנוכחי, התלוי כל כך בלמידת מכונה, עורר מחדש את אותו שיתוף פעולה בדרך חדשה ומרגשת. המעבדה של באוניברסיטת ברקלי היא חלק מתוכנית Machine Common Sense שמנסה לבדוק אם נוכל לתת למערכות בינה מלאכותית יכולות למידה באמצעות היגיון פשוט (common sense) שנראה לנו מובן מאליו אצל ילדים.
לעומת זאת, ילדים קטנים חשופים לסוגים שונים מאוד של נתונים. הם לומדים מחוויות אינטראקטיביות של ממש עם מעט אנשים, בעלי חיים ואובייקטים. המידע שהם מקבלים אינו מפוקח בקפידה, אלא ספונטני ואקראי. ובכל זאת, כפי שניתן לראות בדוגמת מגדל השעון, הם מוצלחים מאוד בהכללות לגבי מצבים חדשים.
ילדים בונים מודלים מופשטים של העולם שסביבם – תאוריות אינטואיטיביות של פיזיקה, ביולוגיה ומתמטיקה, וגם של העולם הפסיכולוגי והחברתי
איך ילדים עושים את זה? אנחנו חושבים שישנן שתי טכניקות בסיסיות שמאפשרות לילדים לחרוג מסוג ההיסקים הסטטיסטיים המקובלים בלמידת מכונה. ראשית, הם בונים מודלים מופשטים של העולם שסביבם – תאוריות אינטואיטיביות של פיזיקה, ביולוגיה ומתמטיקה, וגם של העולם הפסיכולוגי והחברתי. הרעיון שלפיו ילדים הם מדענים קטנים החורגים אל מעבר לנתונים ובונים תאוריות אינו חדש, כמובן. החברה לפיתוח קוגניטיבי חגגה זה עתה שלושימומשהו שנה ל״תאוריית התאוריה״. אולם אחד היתרונות הגדולים של התאוריה, עבור מדענים, ילדים או מחשבים, הוא שהיא מאפשרת לנו לחרוג מן הנתונים שראינו קודם כדי ליצור תחזיות והכללות חדשות לחלוטין. מרגש לחשוב שנוכל לתאר את המודלים הללו מתמטית ולתכנן מערכות בינה מלאכותית שגם הם יוכלו לבנות אותם.
החלק השני בפאזל הוא החקירה. ילדים לומדים באופן פעיל ותוך כדי התנסות – הם לא רק קולטים מידע בצורה פסיבית. הם עושים לעולם דברים כדי לגלות עליו מידע נוסף. לנו זה עשוי להיראות כאילו הם ״דוחפים ידיים לכל מקום״, אבל מבחר מחקרים חדשים בתחום ההתפתחות מראים כי אפילו תינוקות ופעוטות הם חקרנים מפתיעים בתחכום ותבונה, והם מחפשים בדיוק את המידע שהם צריכים ללמוד בצורה היעילה ביותר. ומספר מחקרים עדכניים, ובכלל זה מחקר שנערך במעבדה שלנו, מראים כי ילדים באמת נוטים יותר לחקרנות מן המבוגרים. בתחום הבינה המלאכותית, חוקרים מנסים לתכנן מכונות סקרניות, שיניעו את עצמן ויפקחו על עצמן, כמו ילדים, המחפשים ידע באורח פעיל.
ילדים תמיד מצליחים איכשהו להעלות רעיונות חדשים ובלתי צפויים, שהם גם הגיוניים. מערכות הבינה המלאכותיות הנוכחיות מתקשות בזה יותר
ישנו עוד סוג של חקירה הרלוונטי במיוחד למחשבה על יצירתיות בילדוּת, סוג של חקירה פנימית ולא חקירה חיצונית מהסוג שמחייב ״לדחוף ידיים לכל מקום״. מהיכן מגיעים רעיונות מסוג התשובה לשאלה בדבר השעון הראש מגדל הפעמונים? ילדים תמיד מצליחים איכשהו להעלות רעיונות חדשים ובלתי צפויים, שהם גם הגיוניים. מערכות הבינה המלאכותיות הנוכחיות מתקשות בזה יותר. הן יכולות להצליח מאוד בפתרון של בעיות שמוגדרות בדייקנות, בעיות מוגבלות יחסית, אפילו אם הן קשות מאוד, כמו מציאת המהלך הנכון במשחק שחמט. אבל יצירתיות פתוחה מהסוג שאנחנו רואים אצל ילדים היא שילוב מאתגר של אקראיות ורציונאליות. באינטראקציה עם מערכת כמו GPT-3, אפשר לשים לב שהיא נוטה לסטות מהבנאליות אל חוסר היגיון מוחלט. ילדים מצליחים איכשהו למצוא את המקום המדויק בין המובן מאליו לבין המטורלל.
ניסיון לתכנת מחשבים שלומדים כמו ילדים הוא פרויקט מרתק עבור פסיכולוגים התפתחותיים, כי הוא גורם לנו להבין את הכוח והמסתורין של המחשבה הילדית. ונצטרך לשלב חקירה ובניית מודלים כמו-ילדיים במערכות בינה מלאכותית, כדי לפתור אפילו בעיות פשוטות למדי. על פי ״פרדוקס מוראבץ׳״ הקלאסי בבינה מלאכותית לעתים קרובות דברים שקשים עבור בני אדם הם קלים עבור מחשבים ולהפך. קל יותר לבנות מכונה שיכולה לחשב את צעדי השחמט הנכונים מאשר מכונה שתאסוף פיסות שחמט מפוזרות ותניח אותן על המשבצות הנכונות שבלוח. תכנון של רובוטים שיכולים לקיים אינטראקציות של ממש עם העולם באופן יציב וגמיש קשה הרבה יותר מתכנון מערכות שיכולות לנצח במשחקי מחשב. חקירה ובנייה של מודלים המחקים ילדים עשויה להיות חשוב למטרות שימושיות, כמו רובוט שיוכל לקפל כביסה או למיין ברגים ומסמרים.
מובן שכל ניסיון ליצור את מה שחוקרים מכנים בשם AGI – בינה מלאכותית חזקה שתוכל להשתוות לבני אדם – יהיה חייב לפתור גם את הבעיות הללו. אבל האם אנו אמורים לשאוף לבנות AGI? אולי לא. אולי כדאי יותר לחשוב שבינה מלאכותית יכולה ליצור טכנולוגיות שמשלימות את הבינה האנושית במקום להתחרות בה. וכאן שוב כדאי לחשוב על ההבדל בין מודלים של שפה ובין ילדים בני ארבע.
במאמץ אנושי אדיר, הכלב המלאכותי מסוגל לעלות במדרגות. אבל מה הוא יודע?
מערכות בינה מלאכותית רבות מובנות בצורה הטובה כ'טכנולוגיות תרבותיות'. הן כמו הכתב, הדפוס והספריות, מנועי חיפוש ברשת או אפילו השפה עצמה. הן מסכמות ו'מלקטות' ידע ממקורות שונים במקום ליצור אותו
טענתי בעבר שמערכות בינה מלאכותית רבות מובנות בצורה הטובה ביותר כמה שאנו עשויים לקרוא בשם ״טכנולוגיות תרבותיות״. הן כמו הכתב, הדפוס והספריות, מנועי חיפוש ברשת או אפילו השפה עצמה. הן מסכמות ו״מלקטות״ ידע ממקורות שונים במקום ליצור אותו. הן טכניקות להעברת מידע מקבוצת בני אדם אחת לאחרת, ולא טכניקות ליצירת סוג חדש של אדם. לשאול אם GPT-3 או Dall-E הם אינטליגנטיים או יודעים משהו על העולם, זה כמו לשאול אם הספרייה של אוניברסיטת קליפורניה היא אינטליגנטית או אם מנוע החיפוש של גוגל ״יודע״ את התשובה לשאלותיכם.
טכנולוגיות תרבותיות אינן דומות לבני אדם תבוניים, אבל הן חיוניות לאינטליגנציה האנושית. פסיכולוגים כמו ג׳וזף הנריך טענו כי יכולות תרבותיות אלה להעביר מידע מדור לדור הן לב ההצלחה האבולוציונית שלנו. טכנולוגיות חדשות שמקלות על העברה תרבותית והופכות אותה ליעילה יותר היו מן המניעים הגדולים של הקדמה האנושית. אבל כמו כל הטכנולוגיות רבות העוצמה, הן גם עלולות להיות מסוכנות. סוקרטס חשב שכתיבה היא רעיון רע מאוד. אי אפשר לקיים את הדיאלוגים הסוקרטיים בכתב באופן שבו הם מתקיימים בעל פה, הוא אמר, ואנשים עלולים להאמין שמשהו הוא אמיתי רק משום שהוא כתוב. והוא צדק.
חידושים טכנולוגיים אפשרו לבנג׳מין פרנקלין להדפיס עלונים זולים שהפיצו את בשורת הדמוקרטיה ותמכו בהיבטים המוצלחים ביותר של המהפכה האמריקנית. אבל אותה טכנולוגיה עלולה לשחרר מבול של דיבה ותועבה, כפי שניתן לראות בטוויטר ובפייסבוק, ולתרום להיבטים הגרועים ביותר של המהפכה הצרפתית. אנשים עלולים להיות מוטים, פתיים, גזענים, סקסיסטיים ובלתי הגיוניים. לכן סיכום הדברים של מה שקודמינו חשבו, בין אם בצורת ״סיפורי סבתא״, ספריה או האינטרנט, יכיל את כל המגרעות הללו. והדבר עשוי, כמובן, להיות נכון גם לגבי מודלים של בינה מלאכותית.
חדשנות אנושית תהיה תמיד השלמה חיונית לטכנולוגיות התרבותיות שניצור
פסיכולוגים החוקרים העברה תרבותית ואבולוציה מציינים כי התפתחות תרבותית אפקטיבית תלויה באיזון העדין שבין חיקוי וחדשנות. חיקוי ולמידה מדורות קודמים הם חיוניים ביותר, ופסיכולוגים התפתחותיים הראו כי אפילו תינוקות יודעים לחקות אחרים. מודלים של בינה מלאכותית כמו GPT-3 בעצם מחקרים מיליוני כותבים אנושיים. אבל למידה לעולם לא תוביל להתקדמות ללא יכולת נוספת לחדשנות יצירתית. היכולת של כל דור לשנות, לתקן, לוותר, להרחיב ו(כך אני מקווה) לשפר את הידע ואת היכולות של הדור שקדם לו הייתה תמיד חיונית ביותר לקדמה. זהו סוג החדשנות היצירתית שבו מתמחים ילידים ובני נוער.
תהליך זה של חדשנות יצירתית מותאם לתכנון מערכות הבינה המלאכותית עצמן. בעבר, כשהמצאנו טכנולוגיות תרבותיות חדשות, נאלצנו להמציא גם את הנורמות, הכללים, החוקים והמוסדות שיבטיחו שהיתרונות של מערכות אלה יעלו על העלויות. כתיבה, דפוס וספריות הצליחו רק משום שהמצאנו גם עורכים וספרנים, חוקי דיבה ותקנות פרטיוּת. חדשנות אנושית תהיה תמיד השלמה חיונית לטכנולוגיות התרבותיות שניצור.
אליסון גופניק (Gopnik) היא נשיאת האגודה האמריקנית לפסיכולוגיה
המאמר פורסם במקור ב-Association for Psychological Science. כל הזכויות שמורות לאלכסון.
תורגם במיוחד לאלכסון על ידי דפנה לוי
תמונה ראשית: ילדה משחקת בחול במגרש משחקים. תצלום: ננאד סטויקוביץ'
תגובות פייסבוק
אחד או שניים
הרעיון שלפיו יכולים להיות בלשון שני אלמנטים זהים למראה אך שונים במהותם הוא בסיסי. הניתוח הלשוני אינו מסתכל באלמנט המבודד אלא מתחשב תמיד בסביבתו. ובמובנים רבים, הסביבה היא הכול. ממנה נובעת המשמעות ובה מתגלה ומתממשת הפונקציה. הרעיונות הללו מעט מופשטים, אך הדוגמאות זמינות וברורות מאוד.
קל במיוחד להדגים את הדברים דרך אוצר המילים. למשל, "סוּכר". יש בעברית שתי מילים שצורתן "סוכר", אך המשמעות שלהן שונה. האחת, שנקרא לה לרגע סוכר (1) מציינת של החומר הגבישי המתוק שמופק מקנה סוכר או מסלק וכדומה, חומר מזון המשמש להמתקת משקאות ומאכלים. השנייה, שתיקרא כאן סוכר (2) היא שם כללי לקבוצה של תרכובות כימיות המורכבות מפחמימות ואשר טעמן מתוק. סוכר (1) הוא המוצר שאנחנו קונים לפי משקל ומחזיקים בבית לצורכי המטבח. סוכר (2) הוא סיווג מדעי לחומרים שלא בהכרח משמשים אותנו ברמה הביתית, ושמקוטלגים יחד מן הבחינה הכימית. ההבדל במשמעות הוא חד-משמעי, וההקשרים מבחינת השימוש בשתי המילים יהיו שונים בהחלט. אלא שיש גם הבדל לשוני נוסף וחשוב: סוכר (1) הוא שם קיבוצי וככזה אין צורת רבים שמיוחסת אליו. נדבר על "שני קילו סוכר" או על "כפית סוכר", כלומר על כמות מסוימת של החומר הגבישי. לעומת זאת, כשמדובר בסוכר (2) נדבר בהחלט על "שני סוכרים" ועל "תפקיד הסוכרים" וגם על "חמישה סוכרים", כלומר על חמישה חומרים שונים מהקטגוריה הכימית האמורה. מטבע הדברים, גם ההקשרים שבהם נמצא התבטאויות כאלו יהיו שונים מאלו שבהם ידובר על סוכר (1).
מצב דומה מתקיים בתחום המלוח, שגם בו נמצא מלח (1), הגבישים הלבנים של נתרן כלורי שאנו ממלאים בהם מלחייה ומתבלים באמצעותו את מזוננו, לעומת מלח (2) שהוא כינוי לקבוצת חומרים כימיים בעלי תכונות משותפות. מבחינה לשונית, מלח (1) הוא שם קיבוצי, ואילו למלח (2) מיוחסת צורת רבים, "מלחים", אכן בדומה ל"סוכרים" של סוכר (2). והדמיון הוא גם בשימוש בצורת הרבים בהקשר הנוגע לכימיה.
אלא שהדוגמאות אינן מוגבלות לתחום החומרים והכימיה. אוצר המילים של העברית העכשווית כולל זוג נוסף, שבוודאי אינו יחיד או מיוחד, שבו ניכרת כפילות המזכירה את זאת של "סוכר" ו"מלח", כלומר שני פריטים במילון שנשמעים אותו הדבר (המונח המדויק לכך הוא "הומונימים"), והם שונים, כך שההבדל ניכר גם בעניין קיומה של צורת רבים.
כוונתי ל"ביקורת". גם במקרה הזה, אפשר וצריך לדבר על ביקורת (1) לעומת ביקורת (2). הראשונה היא שם קיבוצי, מופשט: "למתוח ביקורת", "יש לנו ביקורת על החלטות הממשלה" וכדומה. כלומר: ביקורת (1) היא שיפוט שלילי או בכל אופן לא חיובי כלפי דבר מסוים, עמדה של אי-הסכמה, מחלוקת והתנגדות. אכן, שם עצם מופשט, המתפקד כשם עצם שאינו בר-מנייה, כלומר קיבוצי. לעומת זאת, ביקורת (2), בעברית העכשווית, הוא כינוי למאמר ביקורת או לדבר ביקורת ספציפי. "יש הרבה ביקורות על הביצועים של המערכת הזאת", "נשמעו ביקורות מכל הכיוונים על התפוקה של השחקן העונה", "התפרסמו שלוש ביקורות חיוביות על הרומן החדש שלה" – בכולם ברור שמדובר במספר פריטים, כתובים או מדוברים, אך בכל אופן מוגדרים כיחידות, שלכל אחת מהן יש קיום נבדל. ביקורת אחת, שתי ביקורות, שלוש ביקורות, על הספר, על המחזה, עמדות של אנשים שונים שבוטאו בדרכים שונות ובמקומות שונים, לא ביקורת אחת, אלא מספר ביקורות.
ולא זו בלבד, אלא שביקורת כזאת, כלומר ביקורת (2), יכולה גם להיות חיובית. "למתוח ביקורת", כלומר ביקורת (1), תמיד מכוונת לתוכן שלילי. אך ביקורת (2) היא תוצאת מעשה הבעת הדעה, הביטוי המוחשי של הבעת הדעה. לביקורת (1) אין צורת רבים מורפולוגית ואילו לביקורת (2) יש צורת רבים, "ביקורות".
כל ההבדלים הללו, במשמעות, בצורות הרבים, בשימוש, בהקשרים שבהם יימצאו המילים השונות, במקרה הזה ביקורת (1) וביקורת (2), מחייבים לראות בהן שני אלמנטים שונים ונבדלים בלשון. הסדר הטוב והתיאור הממצה דורשים שני ערכים מילוניים נפרדים, אך לא הספר המכונה מילון חשוב ביותר או קובע דברים במציאות הלשונית או בתיאור שלה על ידי הבלשן, אלא מה שעולה מהדוגמאות האמיתיות, האורגניות. תופעת ההומונימיות מתגלה לעתים קרובות ובלשונות רבות מאוד. ניקיון הדעת והשיטתיות בתיאור האמפירי דורשים להתייחס אליה בכל הרמות, במילון, במורפולוגיה ובתחביר.
כולנו יודעים, ובכל זאת
ג'יימס ביילילא נחיה לנצח, אבל אנחנו מתקשים מאוד להבין זאת באמת. הלם קיומי...
X 7 דקות
שקט מצלמים
מור כהןמה הקשר בין צילומי סלפי באתרי הנצחה וזיכרון לשואה למערכון של החמישייה...
X 18 דקות