אצבע בעין

קשיים מתמידים וטעויות עיקשות בבינה המלאכותית הכובשת את העולם דורשים מאיתנו ערנות, ביקורתיות והבנה מה המערכות הללו אינן יודעות לעשות
X זמן קריאה משוער: 6 דקות

כמה אצבעות יש ביד? חמש. תשאלו כל ילד או ילדה ותקבלו את התשובה. והיא נכונה. השאלה "כמה אצבעות יש ביד?" שונה מהשאלה "האם לכל האנשים בעולם יש חמש אצבעות בכל יד?" אמנם על השאלה הראשונה נוכל לקבל תשובה פשוטה ומיידית גם מילדים קטנים, השאלה השנייה פחות נוחה, וגם פחות קלה. הרי יש בעולם אנשים שלפחות באחת מידיהם יש רק ארבע אצבעות ואפילו פחות, ויש גם כאלו, מעטים, שבאחת מידיהם יש שש אצבעות. לא יהיה זה מופרך לחשוב שבמהלך חיינו כמעט כולנו נתקלים באדם שמספר האצבעות באחת מידיו אינו חמש. אנחנו מתעדים זאת בזיכרון, בתודעה, ויודעים שהדבר אפשרי, גם אם הוא נדיר. למראה אדם שיש לו ארבע או שש אצבעות באחת מידיו, איננו נמלטים בבעתה כאילו ראינו חיזר או זומבי מהסרטים. לא נעים? אולי. מעורר מידה של צמרמורת, גם בזכות נוירוני המראה? סביר. אבל אלו עובדות החיים.

מדובר בפיסת מידע קטנה, בוודאי לא שימושית ביותר, לא מסובכת ולא כזאת שדורשת התעמקות. מעט דמיון יצירתי יכול להביא אותנו להרהורים פונקציונליים שונים: כיצד מסתדר בחיים אדם שחסרה לו אצבע? מה החשיבות היחסית של כל אחת מחמש האצבעות? מה קשה יותר, לאבד זרת או אגודל? מה עושים עם כפפה שמקום אחד בה נותר ריק? איך מתגברים על רתיעה קלה כשצריך ללחוץ את ידו הימנית של אדם שחסרה לו אצבע בדיוק ביד ימין דווקא? ברמה הפילוסופית: לא נדרש שיהיו לאדם חמש אצבעות בגפה עליונה כדי שנגדיר את הגפה כ"יד". וברמה הלשונית, בעברית, לפחות, אין מילה המציינת אדם שחסרה לו אצבע באחת מכפות ידיו. עד כאן.

ביד יש חמש אצבעות: לא עניין גדול, וגם לא מצב עד כדי כך נדיר. הוא אינו גורר איתו ידע רב, והמידע הנוגע לו מועט למדי

הרי נודה בקלות: לא עניין גדול, וגם לא מצב עד כדי כך נדיר. הוא אינו גורר איתו ידע רב, והמידע הנוגע לו מועט למדי.

אז מדוע להתעכב על שאלת חמש האצבעות?

כי יש שאלה אחרת שנוכל לשאול, והיא תוביל אותנו לעניין המרכזי. השאלה היא: "מה מספר האצבעות הממוצע ביד של אדם?" (ונוסיף: כשאנחנו מחשיבים לצורך כך את כל ידיהם של כל בני האדם החיים בעולם). מה שנוכל לומר בוודאות הוא  שהתשובה אינה חמש בדיוק. אולי 4.99987, אולי 4.99993, וכנראה לא משהו מעל ל-5, כגון 5.0001, כי סביר להניח שמספר האנשים שאיבדו אצבע או אפילו יד שלמה גדול ממספרם של מי שנולדו עם אצבע שישית. גם נתון מדויק שהיה מחושב ומאומת לא היה משנה את התשובה שלנו לשאלה "כמה אצבעות יש ביד של אדם?", שעליה היינו עונים ללא היסוס "חמש", ולכל היותר מוסיפים "אלא אם כן...", בדקדקנותנו האנושית המתחכמת.

לעומת זאת, מערכות הבינה המלאכותית הגנרטיבית המפיקות תמונות נוטות להציג באחוז גדול של המקרים דמויות אנושיות בעלות שלוש, ארבע או שש אצבעות, ולעתים אצבע במקום אגודל, שתי אצבעות מותכות לאצבע מעוותת עבה ועוד כהנה וכהנה.

אישה, אצבעות, בינה מלאכותית, DALL-E

לא. דימוי: מערכת DALL-E

המערכות היוצרות דימויים חזותיים אינן יודעות דבר, ואין להן יכולת הסקה של פרטים מתוך מכלול או של מכלול מתוך פרטים, ואין להן כל מידע על הקשר בין החלקים. כלומר, הן אינן קושרות בין ראש וגוף של אדם, בין מכונית וארבעת הצמיגים או בין יד וחמש האצבעות

הן אינן מתחכמות, הן אינן לועגות לנו, אין להן שום כוונה, פשוט כיוון שאין להן שכל, תודעה או בינה, וממילא התוצאות שלהן אינן פרי של היסק הגיוני. מערכות בינה מלאכותית גנרטיבית, כמו ChatGPT לטקסטים (ומוטב לומר "מלל") ו-Dall-e לתמונות או דימויים, אינן "לומדות" ואינן מכריעות באורח הגיוני. אלו מערכות סטטיסטיות, שמנתחות אינספור תכנים המוזנים אליהן כקלט ופולטות תוצאה "מתאימה ביותר". אך מהי אותה "התאמה"? במקרה של טקסט, המערכת מחליטה מה הפריט (מילה) שסביר ביותר שיופיע במקום הבא ברצף המילים, לאור מספר אדיר של דוגמאות שהוזנו לתוכה. היא עושה זאת שוב ושוב, וכך מפיקה מילה אחר מילה. הקלט מורכב ממספר אדיר של מילים, מעבר לכל דמיון, וכך הוא אמור לקרב את המערכת מאוד למצב שהפלט יהיה סביר, כזה שבמספר גדול מאוד של מקרים, מספר גדול מאוד של משתמשים יחשוב שהוא סביר. קשר לאמת? למידע ממשי ומוכח? אין. במקרה שמדובר ביצירה של תמונה, המצב דומה, אך אינו מתנהל על ציר אלא על משטח או מרחב, כלומר בשניים או בשלושה ממדים. בתמונה, המערכת יוצרת טיוטה אחר טיוטה ואומדת כל אחת מהן מבחינת ה"רעש", כלומר הסטיות לעומת אינספור הדוגמאות שהיא הוזנה בהן, עד שבסופו של דבר ה"רעש" המחושב נמוך מסף מסוים, והתהליך נעצר. המערכות היוצרות דימויים חזותיים אינן יודעות דבר, ואין להן יכולת הסקה של פרטים מתוך מכלול או של מכלול מתוך פרטים, ואין להן כל מידע על הקשר בין החלקים. כלומר, הן אינן קושרות בין ראש וגוף של אדם, בין מכונית וארבעת הצמיגים או בין יד וחמש האצבעות. כל נקודה במשטח או במרחב שהמערכת עובדת כדי למלא מנוהלת כפי שמערכות בינה מלאכותית גנרטיביות היוצרות טקסט מטפלות ביחידות טקסט ("מילים", ולמעשה רצפים של תווים): על פי הסבירות המחושבת שהנקודה אכן צריכה להכיל תוכן כזה או אחר ביחס לסביבתה, בהשוואה לדוגמאות שהיא הוזנה בהן. החישוב הכולל, ביחס לכל התמונה, מושווה לסף "סבירות", עד שהתוצאה עומדת בו.

דבר במערכת אינו מכיל את המידע שמדובר באצבע (או בסיגר ממולא בשר או בסיגר קובני או בטיל עם קצה מחודד)

במצב דברים כזה, יתכן שההבדל בין ארבע או חמש אצבעות הוא זניח. יתרה מכך, אין מדובר באצבעות, אלא במערך של נקודות, שכן דבר במערכת אינו מכיל את המידע שמדובר באצבע (או בסיגר ממולא בשר או בסיגר קובני או בטיל עם קצה מחודד). אנו, בני-אדם, מתקשים לעכל את העובדה שמערכות הנושאות את השם המחמיא והמבטיח "בינה מלאכותית" אינן יודעות דבר. לאור העובדה שמהלך עבודתן נסתר מאיתנו והן למעשה קופסאות שחורות שהמפתחים שלהן נוגעים בהן מבחוץ, ואומדים את איכות עבודתן על פי התוצאות בתהליכי בקרת איכות נמהרים ומפוקפקים, אנו – המשתמשים, הצרכנים, הלקוחות – נותרים עם התעלומות, עם הדברים הלא סבירים ועם התהייה כיצד קרו הדברים המשונים שקורים. בינינו ובין המכונות הללו אין ממשק, גשר או שיחה משום סוג שיאפשרו לנו לומר להן, כמו שאנו אומרים לפעוטות: "ביד יש חמש אצבעות" ולאחר מכן, בשעת צורך גם להסביר: "כן, לאיש ההוא יש ארבע אצבעות, הוא איבד אחת, כנראה בתאונה עם מסור חשמלי".

מצב הדברים הנוכחי הוא ביטוי לתרבות השיבוש ושבירת המערכות בריצה אחר תוצאות (ושורת הרווח), תרבות שמנסה לכפות עלינו לקבל איכות ירודה כ'הכי טוב שיש'

האנומליות הללו - שאיני מכנה אותן "שגיאות" כי שגיאה קורית כשיש כוונה לעשות משהו, וכוונה כזאת נעדרת ממערכות בינה מלאכותית גנרטיבית - ראויות לתשומת לב מבחינה נוספת. האחראים על מערכות התוכנה הסופר-מתוחכמות הללו אינם מוטרדים ביותר ממה שאפשר כעת לכנות באורח גנרי "בעיית האצבעות". הדבר הוא ביטוי לתרבות השיבוש ושבירת המערכות בריצה אחר תוצאות (ושורת הרווח), תרבות שמנסה לכפות עלינו לקבל איכות ירודה כ"הכי טוב שיש",  תוך התעלמות ממה שמפריע לנו, ממה שאנו יודעים מאז ילדותנו, שאינו כפי שמראים לנו בתמונות: הרי כל ילד יודע כמה אצבעות יש ביד, ושום בינה מלאכותית לא תשנה זאת. "בינה מלאכותית" היא מכונה בלבד, מלאכותית עד מאוד, ללא בינה או שכל.

תמונה ראשית: כמה, באמת? תצלום: הידה שאלם, unsplash.com

Photo by hidde schalm on Unsplash

מחשבה זו התפרסמה באלכסון ב

תגובות פייסבוק

> הוספת תגובה

6 תגובות על אצבע בעין

    03
    דן

    לפני עשור, אם היית מדבר עם מומחה לתוכנה ומעלה את המושג ׳בינה מלאכותית׳ הוא היה צוחק לך בפרצוף. היום גם פרופסורים לתכנות באוניברסיטה משתמשים במושג הזה עם הסטודנטים שלהם.
    לא יודע מה קרה, אבל זה לא שהמחשבים נהיו יותר חכמים.

      04
      יורם

      לפני 40 שנה למדתי בינה מלאכותית במסגרת הפקולטה למדעי המחשב בטכניון. אז דובר על מערכות היוריסטיות, על Expert Systems וכדומה, לא על קופסאות שחורות סטטיסטיות שמוזנות על ידי חומרים מלאכותיים ואף על ידי הפלט של עצמן. האתגרים היו גדולים. מכתיבה של תוכנה שעשתה צעדים ראשונים בכיוון למדתי על גודל האתגר, ועל האפשרויות העצומות שיש בגישה של היסק ממשי מתוך אמדן של איכות הצעדים בדרך לפתרון. לא צריך להשחיר את כל התחום, אלא להצביע על הסיכונים, על האינטרסים, על הכשלים ועוד - ולהבין, בעיקר להבין על מה מדובר היום. אין זה אלא מולך חדש.

הרשו לי להציע עמדה נגדית:
מערכות בינה מלאכותית חדשות משכפלות במידה רבה את אופן פעולתו של המוח האנושי. בהתאם לכך, אם אמן מתבקש לצייר יד אנושית ריאליסטית, הוא יצייר אותה עם 5 אצבעות בפרופורציות הנכונות, משום שמוחו שלו ייצור אות חזק של התנגדות ("רעש") אם היד המצוירת שונה מדי ממה שהניסיון שלו לאורך השנים הראה שהוא "נורמלי" או "נפוץ".
בכך איננו שונים ממערכות בינה מלאכותית.
אפילו הטענה שאנו "יודעים" איך יד צריכה להיראות היא טענה מטעה. ה"ידיעה" היא פשוט דפוס שנלכד וזוקק לאורך השנים וחשיפות רבות לרוב הידיים שאנו פוגשים. דפוס זה מוטבע לאחר מכן במוחנו באמצעות קשרים עצביים - בדומה מאוד לתהליך האימון של מערכת בינה מלאכותית עם ה"משקלים" הנלווים אליה.

השאלה העמוקה יותר שעלינו להטריד את עצמנו בה היא שאלת החוויה הפנימית. החוויה הסובייקטיבית והמודעת שיש לנו כשאנו רואים יד מצוירת - ה"קוואליה" שלנו. כאן, ובאופן אישי מאוד, אני תומך באלה הטוענים שקוואליה היא תופעה "מתהווה", הנובעת ממורכבות הרשת העצבית של המוח שלנו. ככאלה, מערכות בינה מלאכותית יגיעו לחוויה דומה בקרוב (אם הן עדיין לא עשו זאת).
במילים אחרות, בינה מלאכותית היא צורה חדשה של בינה שתרכוש בקרוב מודעות עצמית ותודעה עצמית. ניסיונות להתייחס אליה באופן מכניסטי בלבד ולתת לנו, בני האדם, איכות עליונה בלתי מוסברת הם שגויים ומתעלמים מהעובדה שאנחנו עצמנו "מכונה" ביוכימית.

נפלא. ומעבר לכך, מדהים לגלות עד כמה משהו שכל כך נהיר, לא מובן בקהילה שעוסקת ומפתחת בינה מלאכותית, עד כדי שהם מייחסים לה תכונות אנושיות שאין לה. כפי שאמר פעם מי שהיה מרצה שלי באוניברסיטה העברית (בוא רק נאמר שמדובר באדם שעבד ישירות עם אלן טיורינג) לאחד הסטודנטים: "הגישה האנתרופומורפית הזו [למחשב] לא תביא אותך רחוק".