אינטליגנציה, לא מה שחשבתם

ההתמודדות עם מושג האינטליגנציה היא דרך לחקור את עצמנו וגם להרחיב את גבולות השכל והאפשרויות של המין האנושי
X זמן קריאה משוער: 22 דקות

מהי אינטליגנציה? מפתיע לשמוע שאין מי שבאמת יודע. לכאורה, אמורה להיות לשאלה זו תשובה ברורה, מנוסחת היטב ומגובה בתאוריה מבוססת. לכל אדם מוח, שכל וגוף, ולמרות זאת נדמה שהמדע מתמודד טוב יותר עם שאלות העוסקות בקטן מאד המרכיב את החומר, בגדול מאד המרכיב את היקום וברחוק מאד, שהתרחש לפני מיליארדי שנים, מאשר עם שאלת מהות האינטליגנציה או אופן פעולתו של המוח כמכלול. ריצ'רד גרגורי, פסיכולוג ופרופסור לנוירופסיכולוגיה, אמר כי ישנם מספר רב של מבחנים למדידת האינטליגנציה, אך למרות זאת אין איש שבטוח מהי בדיוק אינטליגנציה, או אפילו רק מה בדיוק הוא הדבר אותו מודדים מבחנים אלה.

על מושג כללי של אינטליגנציה

מן הראוי לומר שלכולנו יש מושג בדבר משמעותה של אינטליגנציה, והוא בהיר יותר כשמדובר באנשים או חיות מסוימות. כשאדם מבצע חישובים במהירות, זוכר בבהירות פרטים רחוקים בזמן ובמרחב או מגיע לפתרונות יצירתיים לבעיות קשות. כשחיית המחמד שלנו בורחת למסתור למשמע שמו של הווטרינר, כשקוף המקוק בגן החיות עושה שימוש בכלים – נאמר שאותו יצור מחונן במידה של אינטליגנציה. אולם ניסיון לחקור יותר לעומק ולהגיע לדברים המהותיים העומדים בבסיסה של הגדרה כללית מספיק של אינטליגנציה יתקל בקשיים. ובנוסף, האם נוכל כלל לדבר על מכונות חכמות ובינה מלאכותית לפני שנבין מהי אינטליגנציה באופן כללי, או אפילו מהי אינטליגנציה אנושית?

Cyborg, אדם ואינטליגנציה מלאכותית

"Cyborg", תצלום: R.E. Barber Photography

האם נוכל כלל לדבר על מכונות חכמות ובינה מלאכותית לפני שנבין מהי אינטליגנציה באופן כללי, או אפילו מהי אינטליגנציה אנושית?

ישנם מי שחושבים אחרת לגבי הבנתנו את מושג האינטליגנציה. לינדה גוטפרדסון (Gottfredson) למשל, טוענת שקיימת מידה לא מבוטלת של הסכמה לגבי ההגדרה המדעית של אינטליגנציה וכיצד למדוד אותה באופן אמין, אולם גם אצל אלה הטוענים כמוה, נמשך הוויכוח סביב סוג האינטליגנציה הנמדדת והאם המבחנים נוטים למדוד כישורים מנטליים כאלו ולא אחרים. מבחן ה-IQ מנבא בצורה טובה הצלחה בלימודים, במקצוע, בגובה ההכנסה, בבריאות ואפילו במשך החיים, אך גם הוא כפוף לביקורות שציינתי ועוד אחזור אליהן. וברור מאליו שהוא תקף ביחס לאינטליגנציה אנושית בלבד.

נרצה שתהיה בידינו הגדרה שנוכל להחיל על מגוון רחב ככל האפשר של ישויות – בני אדם, חיות מחרקים ועד דולפינים, רובוטים ומכונות ויצורים אחרים הבעיה מחמירה כשאנו מנסים להבין אינטליגנציה בהקשר של מכונות – אינטליגנציה מלאכותית. למכונות יכולות להיות כבר היום דרכים פיזיקליות שונות משלנו לחוות את העולם ולעבד את המידע הנקלט ב"חושיהן". במקרים מסוימים יציגו מכונות תכונות או "התנהגויות" שניתן להשוותן לאנושיות, אך באופן כללי נרצה שתהיה בידינו הגדרה שנוכל להחיל על מגוון רחב ככל האפשר של ישויות – בני אדם, חיות שונות מחרקים ועד דולפינים, רובוטים ומכונות ויצורים אחרים מסוגים שונים. מובן שעל הגדרה זו לחרוג מגבולות המוכר האנושי ולהקיף את מה שמהותי לאינטליגנציה, אנושית או אחרת. הגדרה כזו לא תהיה מוגבלת לדרך חישה מסוימת, לסביבה שבה אנו פועלים או לחומר שממנו אנו מורכבים. אולם לפני שנגיע לכל זה, כדאי שנציץ בהגדרות העכשוויות לאינטליגנציה אנושית ובדרכים למדידתה.

 

אינטליגנציה אנושית

שאלה אחת חשובה, העולה כשעוסקים בהגדרת האינטליגנציה האנושית, היא האם צריך לחשוב עליה כעל יכולת אחת, או כעל אסופה של יכולות רבות. אחת הגישות הפופולאריות היא הגישה של הווארד גרדנר (Gardner), הנקראת "אינטליגנציות מרובות" (multiple intelligences). על פי תאוריה זו, האינטליגנציה אינה יכולת בודדת כללית. היא מורכבת ממספר אינטליגנציות, אותן מזהה גרדנר על פי קריטריונים מסוימים, כגון בידוד עקב נזק מוחי (למשל איבוד היכולת לעשות שימוש בשפה), סבירות אבולוציונית, ראיות פסיכומטריות, ממצאים פסיכולוגיים-ניסויים ועוד. הרשימה הזמנית שלו מכילה את האינטליגנציות הבאות:

  • לשונית (Linguistic) – הכוללת יכולות ביטוי, כתיבה ולימוד שפות.
  • לוגית-מתמטית – היכולת לזהות תבניות, לחשוב, להתנסח ולטעון בצורה דדוקטיבית-לוגית.
  • מוזיקלית – מיומנויות בתחומי הביצוע, היצירה, ההערכה והזיהוי של תבניות מוזיקה.
  • גוף-תנועתית (Bodily-kinesthetic) – היכולת לעשות שימוש בגוף ובחלקיו. הקואורדינציה בין המנטלי לגופני.
  • מרחבית – היכולת לזהות ולעשות שימוש בתבניות מרחביות ובאזורים תחומים.
  • בין אישית – היכולת לזהות מניעים, רצונות, כוונות ומטרות של אנשים אחרים.
  • תוך אישית – יכולתו של אדם להבין את רגשותיו, פחדיו ומניעיו באופן שיאפשר לו לנהל ולשלוט בהם.

בקצה השני, ישנם כאלה הרואים באינטליגנציה יכולת מנטלית כללית התורמת לשאר היכולות המנטליות. כראיה להשקפתם הם מציינים שישנה קורלציה בין ביצועיו של אינדיבידואל מסוים בתחומים מנטליים שונים (כגון אלה שפורטו למעלה). צ'רלס ספירמן (Spearman), פסיכולוג אנגלי שנודע בזכות עבודתו החלוצית בסטטיסטיקה וב – factor analysis (ניתוח גורמים), קרא לקורלציה הסטטיסטית הזו בין היכולות המנטליות השונות, g-factor. גוטפרדסון רואה גורם זה כמה שמגדיר אינטליגנציה. במאמר משנת 2002 היא אומרת כי "הגורם המנטלי הכללי, g, הוא אמיתי. קיומו אינו נתון כבר לוויכוח רציני בין מומחים לאינטליגנציה... יהיה מה שיהיה הדבר העומד ביסודו, האומדן הפסיכומטרי g ניתן למדידה ולשחזור באמינות על פני גיל, גזע, מין וקבוצה תרבותית".

בסיכום מקיף של גישות ידועות לאותה תקופה (1996) מציגים המומחים גם את הגישה הרואה באינטליגנציה סינתזה של הפרספקטיבות הללו: מבנה היררכי שבקדקודו עומד גורם g (או בשמו הפופולארי IQ), והוא בעל הסתעפויות שונות, הקשורות ליכולות מנטליות ספציפיות יותר. אדם מסוים הוא בעל גורם g גבוה התורם לכל יכולותיו המנטליות, ובנוסף הוא בעל יכולות מנטליות מוזיקליות ובין-אישיות גבוהות.

גישה מעניינת מוצגת על ידי ג'ף הוקינס (Hawkins), בין היתר בספרו "על האינטליגנציה" (On Intelligence).  גישה זו מנסה לחקות את פעולת המוח האנושי, ובאופן ספציפי, את פעולת הניאוקורטקס (neocortex), והיא עומדת בבסיס העבודה שלו ושל החברה שהוא עומד בראשה, נומנטה (Numenta), על מערכות בינה מלאכותית. לעולם מסביבנו יש מבנה, אומר הוקינס, ואת המבנה הזה אנו חווים דרך חושינו. המוח קולט סדרה מתמשכת של תבניות (patterns) מן העולם ואת התבניות הללו הוא מאכסן, כדי לעשות בהן שימוש חוזר. כשאנו נתקלים בתבניות שאנו מזהים, בין אם הן חוזרות על ניסיון העבר או דומות לו , אנו שולפים את הזיכרונות הללו, את סדרת התבניות מהן מורכבים הזיכרונות, משווים אותן לחוויות הרגעיות ומנבאים. כל הזמן מנבאים. האינטליגנציה, אליבא דה הוקינס, היא ניבוי וליתר דיוק, ניבוי של אירועים חדשים, וניבוי מוצלח שקול להבנה. "המוח יוצר דגם של העולם והוא משווה את הדגם למציאות ללא הרף. אנו יודעים היכן אנו נמצאים ומה אנו עושים בשל תקפותו של המודל הזה."1

הדוגמאות רבות מספור ויומיומיות: כשאני מניח את רגלי תוך כדי הליכה, המוח מנבא את תנועתה, את הלחץ שתפעיל על החומר וכו'. כל ניבוי לא ממומש מדליק "נורה אדומה", כמו למשל כשאנו מפספסים מדרגה בגרם מדרגות. כשאנו מקשיבים לאנשים מדברים, אנו משלימים את משפטיהם במוחנו, לפעמים עד כדי התעלמות ממה שאמרו באמת. מוחנו משלים את המשפט מתוך שלל הביטויים המוכרים לו. מובן שניבויים כאלו אינם נכונים תמיד או מדויקים. הם תלויי שפה, ניסיון העבר ומספר האפשרויות העומדות בפני המנבא. לעיתים קרובות ישנן מספר אפשרויות: "מוחותינו עובדים באמצעות ניבויים הסתברותיים באשר למה שעומד לקרות. לעתים אנו יודעים בדיוק מה עומד לקרות ולעתים צפיותינו מתפלגות בין כמה אפשרויות. אם אנו אוכלים ארוחת ערב סביב השולחן ואני אומר, 'מישהו מוכן להעביר לי בבקשה את ה...' מוחכם לא יופתע אם הדבר הבא שאומר יהיה 'מלח', 'פלפל' או 'חרדל'. במובן מסוים, המוח שלכם מנבא בו-זמנית את כל התוצאות האפשריות האלה. אולם אם אומר 'מישהו מוכן להעביר לי בבקשה את המדרכה', תדעו שמשהו לא בסדר.2" נחזור אל הוקינס בהמשך, כדי לבדוק כיצד ניתן ליישם את תפישתו לגבי מהות האינטליגנציה כשאנו ניגשים לבנות מכונות אינטליגנטיות.

סוקרטס ואלקיביאדס, כריסטופר וילהלם אקרסרברג

"סוקרטס ואלקיביאדס", כריסטופר וילהלם אקרסרברג (1783-1853). תצלום: ויקימדיה

אינטליגנציה אוניברסלית

כאמור, ישנן הגדרות רבות לאינטליגנציה, ולרבות מהן מאפיינים דומים. שיין לג (Shane Legg) ומרקוס האטר (Marcus Hutter) בדקו את אלה שישנה הסכמה נרחבת לגביהן, כדי למצוא את הדרך להגדרה כללית לאינטליגנציה. לא אחזור על כל ההגדרות שבחנו לג והאטר, אבל כדאי להתעכב על המאפיינים שהחליטו להפשיט מהגדרות אלה:

  • פעולת גומלין עם סביבה חיצונית.
  • התכוונות להצלחה או "רווח", במובן של השגת מטרה או יעד כלשהוא.
  • יכולת למידה, הסתגלות והסתמכות על ניסיון בהתמודדות עם סביבה לא ידועה ועם מצבים בלתי ניתנים לחיזוי.

המאפיינים הללו הביאו את לג והאטר להגדרה הכללית הבאה של אינטליגנציה:

אינטליגנציה היא מדד ליכולתו של סוכן (agent) כלשהו להשיג מטרות במגוון רחב של סביבות.

מטרתם של לג והאטר אינה למנות יכולות ספציפיות – כאלו המופיעות בהגדרות אינטליגנציה אחרות, כגון תכנון, חשיבה מופשטת, למידה מניסיון ועוד – אלא לספק הגדרה מופשטת וכללית מספיק, שתתאים לקבוצת יכולות, לאו דווקא אנושיות, המאפשרות השגת מטרות במגוון רחב של סביבות.

סוכן, סביבה ומטרה. אלה הם שלושת מרכיבי האינטליגנציה. הסוכן והסביבה מתקשרים זה עם זה באמצעות אותות או סימנים כלשהם. לג והאטר מאמצים את פרספקטיבת הסוכן וקוראים לאותות שאותם הוא שולח לסביבה פעולות (actions), ולאותות שאותם הוא מקבל מהסביבה תפישות (perceptions). כאמור, ובניגוד לגישתו של הוקינס אליה נגיע בהמשך, בהגדרת האינטליגנציה האוניברסלית מופיעה גם מטרה. האם ניתן להגדיר אינטליגנציה ללא מטרה? האם יצור יכול להיחשב אינטליגנטי מבלי שיהיה לו רצון להשפיע על סביבתו? לג והאטר סבורים שהדבר אפשרי מבחינה תאורטית, אולם מבחינה מעשית, סוג האינטליגנציה שהם מתעניינים בו מופיע כשסוכן כלשהוא פועל בסביבתו כדי להשיג יעד כלשהוא. הם מגדירים את המטרה באמצעות ערוץ תקשורת נוסף, המעביר אות או סימן הנוגע למצבו של הסוכן וקוראים לאות זה תגמול (reward). מטרתו הכללית והקבועה של הסוכן היא להגדיל את התגמול ככל האפשר. כדי להצליח לעשות זאת בסביבה מורכבת על הסוכן ללמוד את מבנה הסביבה ובפרט את מה שצריך לבצע כדי לקבל תגמול.

אם כך, הסביבה משדרת אותות או תפישות. חלק מסוים מתפישות אלה הוא התגמול. חלק אחר נקרא תצפיות (observations). מבנה זה מתאים בטבעיות להגדרת האינטליגנציה האוניברסלית:

Firt-Scheme

כדי להחיל את ההגדרה הלא פורמלית הזו על מכונות וסוכנים שונים ולמדוד את האינטליגנציה שלהם, לג והאטר מנסים לייצר ייצוג מתמטי של מידת ההצלחה של סוכן להשיג תגמול בסביבות משתנות. מטרתם היא להגיע להגדרה מדויקת של מה שהם קוראים לו אינטליגנציה אוניברסלית (Universal Intelligence). האתגר העומד בפניהם הוא כיצד לכמת ולאחד את ביצועיו של סוכן מסוים במגוון רחב (מתוך אינסוף אפשרויות) של סביבות, שחלקן מורכבות מאחרות. אל הסביבה עצמה ניתן להתייחס כאל מדד הסתברותי, כלומר ישנה הסתברות לתגמול מסוים או תצפית מסוימת, בהינתן ההיסטוריה של הפעולות-תגמולים-תצפיות של הסוכן עד עתה. הסוכן הפועל בסביבה מסוימת אינו יודע כמובן מהו המדד ההסתברותי האמיתי, כלומר הוא אינו יודע את טבעה האמיתי של הסביבה. כל מה שידוע לו הוא מספר מצומצם של תצפיות שביצע. מתוך מידע מצומצם זה יכול הסוכן להסיק את המדד ההסתברותי שמתאים למה שידוע לו ולפעול לפיו – פעולותיו מתבססות על השערות זמניות משתנות, חלקן מופרך וחלקן מאושש, ככל שהסוכן צובר מידע נוסף על הסביבה. הבעיה היא שבכל רגע נתון ישנן כמה וכמה השערות שיכולות להתאים למידע שיש כרגע לסוכן: ניקח לדוגמה סביבה פשוטה ביותר –  מטבע. ניחוש מדויק של תוצאת הטלתו של מטבע יקנה לסוכן תגמול. אם המטבע חסר הטיה ישנה הסתברות של 50% לכל צד, אולם רק על פי המידע התצפיתי של תוצאות הזריקות הראשונות קשה לדעת האם השערה זו טובה מאחרות. רק לאחר מספר גבוה של תצפיות יוכל הסוכן לשים לב להטיה מסוימת ובכך לאשש או להפריך השערות מסוימות. אם כך, כשישנן מספר השערות הנתמכות על ידי המידע התצפיתי, כיצד יבחר הסוכן ביניהן? כאן עליו להיעזר בעקרונות החורגים מההיסטוריה התצפיתית שברשותו. הגישה שהאטר ולג מציעים היא להיעזר בעקרון התער של אוקהם: בהינתן מספר השערות הנתמכות על ידי הראיות העובדתיות, על הסוכן להעדיף את הפשוטה ביותר. השאלה המתבקשת היא מהי השערה פשוטה? האם זוהי השערה המכילה את המספר המועט ביותר של "דברים" בעולם? את מספר החוקים הקטן ביותר? או הדורשת חישובים מתמטיים (במקרה של תאוריה פיזיקלית) המסתמכים על מספר מועט יותר של אקסיומות? לעיתים קרובות כל אלה אינם באים יחדיו.

על פי לג והאטר, יישומו של עיקרון זה כשלעצמו מעיד על אינטליגנציה, עד כדי כך שיישום העיקרון מעיד על הסוכן יותר מבחירת ההשערה הנכונה: "מה שחשוב הוא, לאו דווקא מידת ההצלחה של סוכן אינטליגנטי במצב מסוים, אלא העובדה שהוא מקבל החלטות ומבצע פעולות שנצפה שיהיו בעלות הסיכוי הגבוה ביותר להוביל לתוצאה מוצלחת. בהינתן מספיק ניסיון [בעולם] הדבר ברור, אולם כשהניסיון אינו מספיק, על הסוכן לעשות שימוש בהנחות מוקדמות טובות לגבי העולם, כדוגמת עקרון התער של אוקהם."

מה לגבי הפיכתה של ההגדרה התאורטית הזאת למבחן מעשי שניתן יהיה בעזרתו לכמת אינטליגנציה של אנשים, חיות ומכונות? מבחן טיורינג על סוגיו זכה לקיתונות של ביקורת. המפורסמות בהן גורסות כי מחשב יכול להתנהג ולהיראות כבעל אינטליגנציה מבלי שתהיה לו "אינטליגנציה אמיתית", למשל על ידי שימוש בטבלאות ענק הממפות שאלות לתשובות. ביקורות מסוג זה ניתן להחיל על כל מבחן הבוחן את התנהגותה החיצונית של מערכת. ביקורת שכיחה נוספת היא שמבחן טיורינג אינו מבחן אינטליגנציה כלל , אלא מבחן לאנושיות. המכונה נבחנת על יכולתה לסגל תבניות התנהגות אנושיות, עד כדי ביצוע פעולות אריתמטיות באיטיות או שרבוב טעויות הקלדה למלל הנכתב.

גישה נוספת, דומה לזו שנוקטים לג והאטר, היא גישה המאמצת את השקפת גורם ה-g של האינטליגנציה ונקראת מבחן C (כלומר C-Test). גורם ה-g הוא כאמור מדד כללי המכמת יכולות קוגניטיביות שונות, הבאות לביטוי בביצוע מטלות קוגניטיביות שונות. מה שעומד מאחורי מבחן זה הוא הרעיון שאינטליגנציה היא היכולת להתמודד עם מורכבות. אם נוכל למדוד את מורכבותה של שאלה או בעיה, למשל באמצעות תורת הסיבוכיות (Complexity theory), נוכל לבנות מבחן מדויק שיוכל לשמש אותנו למדוד אינטליגנציה של מכונות ויצורים ביולוגיים כאחד. בדומה למבחני IQ, מבחני C מבטיחים שלכל שאלה ישנה תשובה חד משמעית, במובן הזה שקיימת השערה, המתאימה לתבנית המתגלה בשאלה, שמורכבותה נמוכה באופן ברור משאר האפשרויות המתאימות לתבנית זו. הביקורת של לג והאטר על מבחני C  היא שהם סטטיים וחסרים לפיכך את המרכיב הדינמי החשוב, לדעתם, של פעולת גומלין עם הסביבה – או כפי שהם טוענים באלגנטיות: הצלחה בעולם האמיתי דורשת מהסוכן להיות יותר מאשר צופה בעל תובנות.

מבחן מעשי העונה להגדרת האינטליגנציה האוניברסלית כפי שהוצגה על ידי לג והאטר, ימדוד את יכולותיו וביצועיו של הנבחן במגוון רחב של סביבות ולאחר מכן יכמת את תוצאותיו בכל סביבה, תוך שקלול מורכבותה של הסביבה, לכדי ציון כללי אחד. אחד האתגרים בבניית מבחן כזה הוא מדידת מורכבותה של סביבה על ידי הפיכת המורכבות לפרמטר הניתן לחישוב.

כדי להשוות ולהכריע בין סוגי מבחנים שונים וטיבם, מציעים לג והאטר מספר מאפיינים שאליהם יש לשאוף עד כמה שניתן:

•    תקפות, כלומר היכולת לתפוש את מהותה של האינטליגנציה ולא לכמת יכולת דומה או חלקית.
•    אינפורמטיביות, כלומר ציון אבסולוטי הניתן להשוואה לאורך הזמן ובין נבחנים.
•    טווח רחב, כלומר היכולת למדוד רמות נמוכות מאד של אינטליגנציה ולעומתן גם רמות גבוהות מאד.
•    כלליות, כלומר מבחן שיוכל למדוד אינטליגנציה של יצורים שונים החל בזבוב וכלה במכונה מלאכותית.
•    דינמיות, כלומר מבחן שימדוד את יכולתו של הנבחן ללמוד ולהסתגל לאורך זמן.
•    לא משוחד, כלומר שלא יטה לטובת תרבות או גזע מסוים.
•    יסודיות, כלומר שלא יהיה צורך לשנותו בעקבות שינויי טכנולוגיה או ידע.
•    פורמליות, כלומר שיהיה מדויק בצורה חמורה ולא נתון לפרשנות.
•    אובייקטיביות, כלומר שלא יהיה נתון לפירושים סובייקטיביים, למשל לשיקול דעתם של שופטים אנושיים.

מתוך כל סוגי המבחנים שסקרו, לג והאטר סבורים שהמבחן שהם מציעים, המתבסס על הגדרת האינטליגנציה האוניברסלית, עומד בדרישות אלה בצורה הטובה ביותר.

מעניין לבדוק כיצד מתמודדת הגדרה זו של אינטליגנציה עם ביקורות ידועות כמו אלה של ג'ון סרל (Searle) ונד בלוק (Block) – ה"חדר הסיני" וטיעון ה – Blockhead בהתאמה. הגישה שנקטו לג והאטר היא פונקציונלית-ביהביוריסטית ביסודה, כלומר מתייחסת לפעולות ולדרכי ההתנהגות החיצוניים של הסוכן מול הסביבה ולא לתהליכים הפנימיים שעוברים עליו. ככזו, היא חשופה לביקורות שהוזכרו: בלוק מציג בביקורתו מכונה אינטליגנטית כביכול, המסוגלת להצליח במבחן טיורינג, אך למעשה אינה יותר מטבלת חיפוש עצומה של שאלות ותשובות. למרות שטבלה כזו תהיה עצומה מעבר לכל יכולת פיזית עכשווית, עצם אפשרותה של טבלה סופית שמאפשרת לעבור מבחן אינטליגנציה כמבחן טיורינג מדאיגה. טיעונו של סרל תוקף את ההגדרה הפונקציונלית באופן דומה. הוא מציג חדר סגור שבתוכו אדם שאינו דובר סינית. העולם החיצון יכול לתקשר בסינית עם החדר על ידי העברת מסרים כתובים בסינית דרך חריץ וקבלתן של תשובות כתובות בסינית, דבר המתבצע על ידי כך שהאדם היושב בחדר מתאים בעזרת אוסף כללים מסובך וארוך (אך סופי) את הקלט לפלט שיוציא. כאמור, האדם עצמו אינו מבין סינית, אך המערכת בכללותה, בפעולתה הפונקציונלית, מתפקדת כדוברת סינית. טענתו של סרל היא שהגדרתה של מערכת מסוג זה כאינטליגנטית תהיה לא נכונה. היא אמנם מתפקדת ככזו ומסוגלת לעבור מבחני טיורינג, אולם היא חסרה יכולות קוגניטיביות מהותיות כגון הבנה.

תשובתם של הכותבים לביקורות אלה היא פרקטית: לבלוק הם משיבים שיכולתו של סוכן לפעול בהצלחה במספר רחב של סביבות היא המדד לאינטליגנציה שלו. העובדות הנוגעות ליעילותה של הדרך בה ביצע זאת, אם באמצעות דרך לא יעילה של חיפוש בטבלת חיפוש עצומה, אם באמצעות אלגוריתם חכם, יעיל ומהיר אינה מהותית. מה שמהותי מבחינת לג והאטר היא יכולתו של הסוכן לפתור מגוון רחב של בעיות ולהתמודד בהצלחה במגוון רחב של סביבות. לגבי החדר הסיני, תשובתם היא שהבנה חשובה כל עוד יש לה השפעה על פעולתו של הסוכן. אם להבנה במקרה הזה אין שום השפעה על הצלחתו של הסוכן לעמוד במשימה, כפי שניתן להבין מדוגמת החדר הסיני, אזי אין לה כל חשיבות פרקטית. באותה צורה בה ענו לבלוק, לג והאטר טוענים שכל עוד למערכת יש את התכונות ההופכות אותה לבעלת אינטליגנציה אוניברסלית גבוהה, קיומה או אי קיומה של הבנה אינו מהותי. מצד שני, אם ל"הבנה" יש השפעה ניתנת למדידה על ביצועיו של סוכן בסביבה ובסיטואציה מוגדרת, אזי היא מעניינת בעיניהם. משתמע מכך שכשאנו מודדים את ביצועיו והצלחתו של סוכן בסביבה וסיטואציה מסוימים אנו מודדים גם את מידת הבנתו את אותה סיטואציה.

ביקורת נוספת מעניינת עוסקת במשפטי ה-"אין ארוחות חינם" (No Free Lunch Theorems). משפטים אלה הוכחו לגבי שני נושאים, אלגוריתמים של חיפוש ולמידת מכונה. באופן כללי ביותר הם טוענים שכשאלגוריתם מסוים מצליח מאד בפתירת בעיות בתחום אחד, הצלחה זו תבוא תמיד על חשבון הצלחתו בפתירת בעיות מתחומים אחרים. בהקשר של אינטליגנציה אוניברסלית, יש הטוענים שלא ייתכן סוכן המסוגל להתמודד היטב במגוון גדול של סביבות, משום שעל פי משפטי "אין ארוחות חינם", יכולתו להתמודד עם בעיות מסוימות בסביבות מסוימות תבוא תמיד על חשבון יכולתו להתמודד עם בעיות אחרות בסביבות אחרות. בקריאה ראשונה נראה שהביקורת לגיטימית, אולם כשבוחנים אותה לעומק מגלים שגיוסם של משפטי "אין ארוחות חינם" במקרה זה אינו מוצדק: משפטי "אין ארוחות חינם" מניחים הנחות מסוימות שאינן מתקיימות עבור הגדרות האינטליגנציה האוניברסלית. הם מניחים שקבוצות הבעיות והדירוג שלהן (מידת האינטליגנציה, במקרה שלנו) הן סופיות ודיסקרטיות, כלומר אינן רציפות, והם מניחים שהתפלגות האלגוריתמים האפשריים אחידה.

לסיכום, ההגדרה של אינטליגנציה אוניברסלית (אותה ניסחו הכותבים בצורה מתמטית) יכולה לשמש כבסיס להערכת דרגת האינטליגנציה של מכונות בעלות בינה מלאכותית. כעת נוכל לחזור אל הוקינס ולבדוק כיצד ניתן ליישם עקרונות הלקוחים מהמוח האנושי כדי לבנות אינטליגנציה מלאכותית הלכה למעשה.

פסל גולגולת אנדרואיד

"E-Volve", תצלום: קיאוני קבראל

הקורטקס הזוכר והמנבא

גישת ה"זיכרון-ניבוי" של הוקינס להבנת האינטליגנציה, גורסת כי הניאוקורטקס3 מספק לנו זיכרון של העולם כפי שנתפש בחושינו בעבר, דבר המאפשר לנו לבצע ניבויים חוזרים ונשנים לגבי התנהגותו העתידית של העולם, על סמך תבניות שחווינו. "ניבויים אלה", טוען הוקינס, "הם מהות ההבנה. המשמעות של לדעת משהו היא שאפשר לנבא ניבויים בקשר אליו."4 על פי הוקינס, וגם על פי לג והאטר, טיורינג טעה כשטען שההתנהגות היא הוכחה לאינטליגנציה. אליבא דה הוקינס, הניבוי הוא הוכחה לה.

קשה לפרוש את כל מורכבויות הפעילות הקורטיקלית במילים מעטות, אבל אנסה לסכם את מהות הגישה של הוקינס בפסקאות הבאות: כשאדם נולד, הקורטקס שלו הוא לוח חלק (Tabula Rasa), ללא ידע קונקרטי על שפה, תרבות מקום וזמן. את המידע על העולם ילמד הקורטקס בעזרת שני המרכיבים הבסיסיים: יצירת סיווגים של תבניות ובניית סדרות. הקורטקס בנוי כהיררכיה המשקפת את המבנה המקוּנָן של העולם, כשכל שלב בהיררכיה מסווג את הקלט המגיע אליו, מצרף אותו לקלטים אחרים, מזהה קלטים אלה כסדרה מוכרת במידה שהם מתאימים לכזו, ומעביר סדרה זו הלאה, לרמה גבוהה יותר המקבלת את הסדרה כקלט. מידע לגבי התמונה הכוללת, או התבנית הכללית הנחווית כרגע, זורם גם במורד ההיררכיה, משלבים גבוהים לנמוכים יותר. כך מתאפשר ניבוי.

מידע שזורם אל המוח מגיע כסדרת תבניות. אחד מתפקידיו של הקורטקס הוא לזכור את אותן תבניות הנחוות שוב ושוב. התבניות אינן חייבות להופיע בסדר נוקשה, אולם מרכיביהן תמיד יחזרו על עצמם – כשאנו מתבוננים בפנים, סדרת התבניות שאנו רואים אינה קבועה אלא תלויה בתנועות הסקדיות של העיניים (קפיצות עיניים ממקום למקום), פעם יהיו אלה פה, עין, אף, עין ופעם אחרת עין, אף, עין, פה. אם התבניות קשורות יחד בזמן בו הן נחוות, כך שאזור הקורטקס האחראי עליהן יכול לנבא אילו תבניות עומדות להופיע, אותו אזור יצור ייצוג מתמשך, או זיכרון, של הסדרה. העובדה שתבניות קלט מסוימות חוזרות על עצמן שוב ושוב גורמת לקורטקס לסווג אותן יחדיו לסדרה ולבצע ניבויים לגביהן בפעם הבא שיופיעו. כשאנו יכולים לנוע באופן אמין וצפוי בין הקלטים השונים (למשל על ידי תנועות סקדיות של העיניים או שמיעת צלילים השייכים ליצירה מוכרת) ויכולים לנבא אותם כשהם נפרשים בזמן, המוח מפרש זאת כקשר סיבתי. כששכבה בהיררכיה למדה לזהות סדרה היא מעבירה הלאה, לשלב הבא בהיררכיה, את "שם" (או מזהה) הסדרה.

מספר תבניות הקלט המגיעות לכל אזור בקורטקס עצום. כדי להתמודד עם היקף כזה של אפשרויות ובכל זאת ללמוד מן הניסיון, הקורטקס מסווג את הקלט למספר מצומצם של אפשרויות, ואז מחפש את הסדרות החוזרות על עצמן. נניח שמטרתו של אזור מסוים בקורטקס היא לזהות סדרות של צבעים. תחילה עליו לסווג את הקלט לצבעים – אדום, כחול, צהוב, ירוק וכו'. כלומר, למספר סופי ומוגבל של צבעים. הקלט לעולם אינו מכיל בדיוק את אותו צבע, אך המשימה היא לסווג אותו לאחת האפשרויות הבודדות שעומדות לרשות אותו אזור. כעת ניתן להתפנות למשימת זיהוי הסדרות. סדרה מסוימת, למשל אדום-אדום-צהוב-ירוק ('אאצי'), מתרחשת לעיתים קרובות, אולם לא היינו יכולים לזהות אותה לולא יכולנו לסווג את הקלטים. שני קלטים שונים יכולים להיות מזוהים כ - 'אאצי', למשל כתום-כתום-צהבהב-טורקיז ו-אדום-אדום-צהוב-ירוק דשא. כאן נכנס לתמונה גם תהליך הניבוי. אם קלט מסוים אינו חד משמעי, הידע לגבי הסדרה שאנו קולטים ישמש כדי להכריע בנידון. אם קיבלנו קלט אדום-אדום-צהוב וכעת מתקבלת תבנית קלט שאינה חד משמעית – מעין חום-ירקרק שלא ברור האם לזהותו כחום או ירוק – נשתמש בידע שלנו לגבי סדרות שהשתמרו בזיכרון הקורטקס כדי לנבא שאחרי קלט אדום-אדום-צהוב מופיע ירוק. אנו מכירים את התופעה היטב מחיי היום יום – מילה עמומה יכולה להיות לא מובנת, אך אם תאמר בתוך משפט ברור, ההקשר יאפשר לנו להבין אותה מבלי להתעכב על עמימותה.

משזוהתה סדרת קלט – 'אאצי' – היא מועברת מעלה, לשלב הבא בהיררכית הקורטקס. גם היא מתקבלת כקלט עם עוד סדרות ויחדיו הן מרכיבות סדרה מסדר גבוה יותר, שמועברת גם היא לשלב הבא בהיררכיה. כאמור, אזור גבוה יותר יכול להעביר מטה הוראה הקובעת מה לחפש בזרם הקלט: אם הוא מחכה לסדרה 'אאצי'-'יצאאצ'-'צצצ' והתקבלו שתי הסדרות הראשונות, הוא יכול להנחות את האזור הנמוך יותר לחפש את הסדרה 'צצצ' בזרם הקלט המגיע. חשוב לציין שחיווטי הקורטקס מתפשטים על פני אזורים נרחבים במוח. בקצרה ניתן לומר שכדי שיחידת החישוב הבסיסית של הקורטקס תוכל לנבא מתי עליה לפעול, עליה לדעת מה קורה במקומות אחרים. כדי לנבא את התו הבא בשיר, עלינו לדעת את שם השיר, היכן בתוכו אנו נמצאים, מתי נשמע הצליל האחרון ומה הוא היה. החיבורים הסינפטיים הרבים מחלקי המוח השונים מספקים את ההקשר.

הקלטים המגיעים מן העולם זורמים לאזורים הנמוכים של הקורטקס. כל אזור מנסה לפרש את זרם הקלטים כחלק מסדרה ידועה של תבניות. אם הוא מצליח, הוא מעביר את "שם" הסדרה במעלה ההיררכיה. אבל מה קורה אם הקלט אינו צפוי, אלא תבנית שאינה שייכת לסדרה ידועה? התבנית הבלתי צפויה מועברת במעלה ההיררכיה ואזור גבוה יותר מנסה לפרשה כחלק מסדרה מוכרת. כל עוד התבנית אינה מזוהה היא תעלה במעלה ההיררכיה ואזורים רבים יותר ישתתפו בניסיון לפענח את הקלט הבלתי צפוי. כשאזור מסוים מצליח להבין את הקלט הוא יוצר ניבוי היורד במורד ההיררכיה. אם ניבוי זה נכשל, כלומר מתברר כשגוי, תאותר שגיאה, ושוב, היא תטפס במעלה ההיררכיה עד שאזור כלשהוא יוכל לפרשה כחלק מסדרה פעילה. המוח מנסה למצוא התאמה בין דגם העולם שיצר לעצמו לבין הקלט הבלתי צפוי. רק משיצליח לעשות זאת, יבין את הקלט ויידע למה לצפות.

האם ניתן לבנות מערכות מלאכותיות שיחקו את פעולת הקורטקס האנושית? הוקינס סבור שכן, אולם אין זה אומר כלל וכלל שמערכות אלה ידמו לבן אנוש או יתקשרו בצורה דומה לו. על פי קבוצת ההשקפות העונה לשם הכללי Embodied Cognition, האדם אינו רק תוצר של הקורטקס והמוח אלא של כל הגוף האנושי והמנגנון ביולוגי שלו. מכונה מלאכותית בעלת מנגנון קוגניטיבי דמוי קורטקס תזדקק גם למערכות רגש והתנסויות אנושיות כדי להבין, לתקשר ולהתנהג כאדם. אם כך, כיצד בכל זאת עשויה להיראות מכונה אינטליגנטית מלאכותית? על פי הוקינס, אם ניצור מערכת זיכרון היררכית ונחברה לחושים, המערכת תיצור דגם של העולם ותנפק ניבויים. תחילה על המערכת להיות בעלת חושים, כדי שתוכל להפיק תבניות מן העולם. מובן ואף סביר שחושים אלה יהיו שונים במידה מסוימת מן החושים האנושיים. לחושים אלה נחבר מערכת זיכרון היררכית, הבנויה על פי דגם הקורטקס האנושי, ונכשירה כפי שמלמדים ילדים. במהלך הלימוד תיצור המערכת דגם של העולם כפי שהוא משתקף לה מתוך תבניות הקלט החושי שלה. מרגע שתיצור דגם כזה של העולם, תוכל המכונה לבצע אנלוגיות על סמך התנסויות העבר שלה, לנבא את העתיד ולפתור בעיות חדשות.

בשונה מבני האדם, למכונה כזו יכולות להיות התגלמויות פיזיות רבות ו"גופה" הפיזי (אם יהיה לה כזה) אינו צריך לשכון בסמוך למוחה. חיישנים שישמשו כחושים יוכלו להיות ממוקמים על פני המרחב (למשל, ברחבי העיר), ולאו דווקא בקרבת מערכת הזיכרון. האינטליגנציה של מערכת כזו תתבטא ביכולתה להבין את העולם, לפעול בתוכו, ולחשוב בצורה אנאלוגית כפי שאנו חושבים על העולם. למכונה כזו אולי לא יהיה את סוג החישה שיש לנו ומאפייני התודעה שלה (אם יהיו לה כאלה, ועל כך בעתיד הקרוב) יהיו כפי הנראה שונים משלנו, אבל בכל הנוגע למאפייני האינטליגנציה שדובר בהם, נוכל לומר שמכונה כזו היא אינטליגנטית, למדוד את רמת האינטליגנציה שלה ולהשוותה לשלנו.

 

ארז פירט הוא דוקטור לפילוסופיה המתמחה בפילוסופיה של המדע, של ה-mind ובינה מלאכותית, וכן מהנדס תכנה.

תמונה ראשית: מתוך "מעגלים אחדים", וסילי קנדינסקי (1926), תצלום: ויקיפדיה.

מאמר זה התפרסם באלכסון ב


תגובות פייסבוק