צייד לקט ומתוכנת

אנו מסווגים, כל העת, ללא לאות. האם המיון לקטגוריות הוא תכונת יסוד קדומה שלנו?
X זמן קריאה משוער: 11 דקות

צייד-לקט מהתקופה שלפני המהפכה החקלאית, מבחין ממרחק של כ-15 מטרים בחפץ אדום על הקרקע, במהלך שיטוטו בג'ונגל. כיצד הוא מחליט לנהוג?

עליו לדעת אם צריך להיזהר מאותו חפץ, או אולי, דווקא, לקחת אותו איתו כי יש לו ערך רב. התנהגותו ומעשיו, תלויים בידע שלו על העולם בו הוא חי. אך כיצד מתורגם הניסיון האישי של אותו צייד-לקט, כל הדברים שלמד בחייו, למערכת של ידע המשרתת אותו כדי לשרוד? עליו לסקור את המאפיינים של החפץ כפי שהוא תופשו בחושיו, ולחפש דמיון בינו לבין חפצים אחרים בהם נתקל בעבר, כך שידע כיצד לנהוג. עליו 'לסרוק' את מוחו, לנסות לאתר התאמה בין אותו חפץ לבין 'דברים מסוכנים', או לחילופין 'דברים בעלי-ערך'.

כלומר, אם נאמץ את הרעיון שהמוח האנושי דומה למחשב, הצייד-הלקט 'מריץ' אלגוריתם בראשו כדי להחליט כיצד לפעול.

בלי הטלפון החכם, אנחנו ככל הנראה משתמשים במערכת ידע זהה לזו של הצייד-הלקט

זברות מסתתרות בעשב גבוה

זברות מסתתרות. תצלום: אדוארדו סארטה

השימוש שלנו בקטגוריות הוא בסיסי ומהותי לעצם התפקוד השכלי שלנו, ומעצב במידה רבה את הידע שלנו על העולם

לפני שנעשה את קפיצת הזמן הגדולה, לתקופה שבה צאצאו של הצייד-הלקט מצויד באפליקציה לזיהוי בטלפון החכם שלו, במהלך שיטוטו בג'ונגל של בטון, מעניין לבחון את האופן שבו ידע מאורגן במוחנו. על אף מהפכת המידע, מבחינת מבנה והתמחות תפקודית, מוחנו דומה עד מאוד למוחו של אותו צייד-לקט. בלי הטלפון החכם, אנחנו ככל הנראה משתמשים במערכת ידע זהה לזו של הצייד-הלקט: מערכת ידע המבוססת על קטגוריות ועל קטגוריזציה.

בחיי היום-יום אנחנו נתקלים בשיטת הסיווג לקטגוריות בהזדמנויות רבות: בחנויות, במחסנים, במנועי חיפוש ומאגרי מידע, בתחרויות של ספורט, אמנות ותרבות. אולם קטגוריות קשורות גם לתודעה שלנו, לתפישה שלנו את הסביבה, ולשיפוט שלנו אם בגד מסוים הוא אדום, אם מכר שלנו הוא גם חבר אמיתי, או אם פשע מסוים נושא עמו קלון. כלומר, השימוש שלנו בקטגוריות הוא בסיסי ומהותי לעצם התפקוד השכלי שלנו, ומעצב במידה רבה את הידע שלנו על העולם. אולם מהן קטגוריות? מהי טיבה של פעולת הקטגוריזציה?

קטגוריה היא קבוצה הכוללת מספר אובייקטים אשר נחשבים לשווים; חברים בקטגוריה. על מנת שהאובייקטים ייחשבו שווים, יש לייחס להם תכונות/מאפיינים מסוימים, המהווים תנאי להשתייכותם לקבוצה. אך מה קורה כאשר הסביבה משתנה? אובייקט כלשהו עשוי להיות מסוכן בסביבה אחת, ובעל ערך רב בסביבה אחרת. כלומר, הגבולות של קטגוריות עשויים להיות דינאמיים ומושפעים מן ההקשר של הסיטואציה. חשבו על כל הפעמים בהם אתם משתמשים בביטויים כמו 'בערך', 'סוג של' ו-'כמעט' בנוגע לשיוך של אובייקט מסוים לקטגוריה.

הגישה הקלאסית לגבי קטגוריות, כפי שניתן למצוא בתרבויות מערביות מן העת העתיקה, הייתה מחמירה וברורה ביותר: אובייקט כלשהו שייך לקטגוריה X, או שאינו שייך לקטגוריה X. עבור גישה נוקשה כזו, יש להחליט על גבולות ברורים וניתנים לאימות, כמו גם על התכונות/מאפיינים ההכרחיים להיכללות בקטגוריה מסוימת. לעומת זאת, הגישה המודרנית מייחסת גמישות רבה יותר להשתייכות לקטגוריות, וכמו כן מעניקה משקל רב לשאלת ההקשר הסביבתי והתכונות האופייניות לחברים בקטגוריה כלשהי.

המתח הקיים בין השתייכות נוקשה וברורה של אובייקטים לקטגוריות, לבין השתייכות מדורגת, נידון על ידי הפילוסוף של השפה לודוויג ויטגנשטיין, באמצעות הרעיון של ה-'דמיון המשפחתי': חלק מן התכונות של קטגוריה מופיעות באובייקט וחלק לא מופיעות, כשם שבין בני משפחה יכול להופיע דמיון בהיבט אחד של הפנים, אך שוני בהיבט אחר. הדוגמה המפורסמת של ויטגנשטיין עוסקת בקטגוריה 'משחק', המכילה משחקי לוח, קלפים, ספורט, וכמו כן משמשת לתיאור מצב שבו ילד משליך כדור אל עבר הקיר ותופס אותו בחזרה. השוני עולה על הדמיון בתכונות של חלק מחברי קבוצה זו, אך בכל זאת אנחנו תופסים אותם כמשתייכים לאותה קטגוריה 1.

הלוגיקה והפילוסופיה של השפה הכרחיות לדיון בקטגוריות, שכן במובנים מסוימים, ניתן לחשוב על קטגוריות כעל מושגים, ועל פעולת הקטגוריזציה כעל יכולת לוגית-שפתית, וחוקרים רבים אכן מתייחסים לזהות של תופעות אלו. כל מושג הוא קטגוריה, אליו משייכים אובייקט בעל מאפיינים כלשהם, על סמך דמיון ושוני. לקטגוריות יש הגדרות וגבולות בדומה למושגים, כל זאת כדי לאפשר תקשורת יעילה בין אנשים.

בנוסף, הקטגוריזציה היא תופעה רקורסיבית, בדומה לשפה: כשם שניתן ליצור אינסוף מבעים/משפטים שונים, על ידי הוספה בלתי-נגמרת של תיאורים ורשמים, כך גם ניתן ליצור אינסוף קטגוריות על ידי צמצום ופירוט. "כיסא עץ לבן, בעל משענת מרובעת, מסעדים מעוגלים..." וכו'.

ילדים משחקים בגולות, פרו

ילדים משחקים בגולות בפרו. תצלום: שון הרקוואל.

לענייננו, נניח שהידע שלנו על העולם אכן מבוסס על 'חומרה' בדמות מנגנוני השפה והזיכרון, אך ננסה להתייחס אליו בנפרד מן היכולת השפתית והזיכרון כשלעצמם. נתמקד בתופעות הנגלות של הקטגוריזציה, המתקיימות ב-'רמת התוכנה', ונזכיר במעט את 'רמת החומרה' של המנגנונים המוחיים המדויקים, אותם עדיין אין לנו את הכלים הדרושים כדי לתאר בפירוט.

אם כן, כיצד אנחנו עושים סדר בריבוי העצום של הגירויים והמידע סביבנו באופן היעיל ביותר? האם המוח האנושי התפתח והתעצב כך שהוא מייצר אופן ארגון-ידע מסוים? ומה קורה ברמות הגבוהות יותר של החשיבה? האם האופן שבו אנחנו מעריכים מידע, מתלבטים בנוגע להחלטות, שופטים את המציאות הסובבת אותנו - האם גם תהליכים אלו מבוססים על תבניות ועל דפוסי פעולה קבועים מראש? נראה שהתשובה לכך היא כלכלית בבסיסה, שכן הקטגוריזציה, הינה הדרך האופטימלית לארגון הידע שלנו על העולם. מדוע?

על פי ההיגיון הכלכלי, הסחורה המבוקשת היא ידע על העולם, כלומר, מידע משמעותי ורלבנטי מתוך כלל הגירויים, שבאמצעותו ניתן לייצר ציפיות ולקבל החלטות באופן המיטבי. המשאב הנדרש לשם כך הוא מאמץ מנטלי, אנרגיה כימית וחשמלית המושקעת במערכת הקוגניטיבית, במוח.

הטענה של חוקרים קוגניטיביים היא כי הקטגוריזציה מייצרת מקסימום מידע במינימום מאמץ מנטלי. לשם כך נדרשים זיהוי ומובחנות של גירויים ברמה הגבוהה ביותר, ויכולת היסק נרחבת ככל האפשר. כלומר, על מנת לייצר מידע רב ככל האפשר מכל גירוי בסביבה, עלינו להחליט בקלות המרבית האם הוא שייך לקטגוריה כלשהי, ולאחר מכן לייחס לו תכונות/מאפיינים מתאימים רבים ככל האפשר, בדרך של היסק.

אם לבעל-חיים יש נוצות, הוא שייך לקטגוריית הציפורים, ובעל התכונה/מאפיין של 'מסוגל-לעוף'. כלומר, יעילות כלכלית תתבטא ביכולת להסיק על סמך תכונה אחת של האובייקט שמולנו, תכונות אחרות רבות ככל האפשר, הודות לכך שזיהינו אותו כשייך לקטגוריה ידועה, בעלת מאפיינים ידועים.

בנוסף, פעולת הקטגוריזציה יוצרת היררכיה בין קטגוריות, יחסי הכלה של קטגוריות שונות, המכונים טקסונומיה, המאפשרים לנו להסיק מידע באופן יעיל. כאשר שייכתי אובייקט מסוים לקטגוריה 'ציפור', ואני יודע שציפורים משתייכות בעצמן לקטגוריה הרחבה יותר 'בעלי-החיים', אני יכול מיד להסיק שלאותו אובייקט, אותה ציפור, יש את כל התכונות/מאפיינים של בעלי-חיים.

אם כן, על פי ההיגיון הכלכלי, כדי לבזבז מינימום אנרגיה בתהליך, כדאי שקטגוריות יהיו מופרדות זו מזו ככל האפשר, כך שכבר על סמך תכונה/מאפיין אחד, נוכל לשייך אובייקט מסוים לקטגוריה כלשהי. זהו כוח הדוחף את הקטגוריה להיות מצומצמת ככל הניתן, ולכלול אובייקטים ומאפיינים מעטים ככל האפשר, לצורך זיהוי והפרדה בין קטגוריות.

מצד שני, יכולת ההיסק שלנו תגדל, ככל שקטגוריה תכיל יותר אובייקטים ומאפיינים. אז ניתן יהיה לייחס לאובייקטים המשתייכים אליה יותר תכונות/מאפיינים. אלו הם שני הכוחות המנוגדים באשר למידת ההכללה של קטגוריות, כוחות המעצבים את הגבולות של קטגוריות ואת התכונות של החברים בהן.

לשייך אובייקט מסוים לקטגוריה 'כיסאות עץ לבנים בעלי משענת מרובעת ומסעדים מעוגלים', מבלי להיות מסוגלים לתפוש אובייקט כזה כמשתייך לקטגוריה הרחבה יותר 'כיסאות', יהווה מכשלה ליכולת ההיסק – הכללה ברמה נמוכה מדי. שכן מאפיינים רבים של אותו אובייקט משותפים לכלל הכיסאות. מצד שני, גם שיוכו לקטגוריה 'עצם מוצק' אינה תורמת מספיק מידע בהיסק, שכן המאפיינים הייחודיים שלו ככיסא יאבדו – זו תהיה הכללה ברמה גבוהה מדי.

כוחות מתנגשים אלו יוצרים בסופו של דבר אופטימיזציה כמותית, באשר לגבולותיהן של קטגוריות, ובאשר למידת ההכללה שלהן. כך ניתן לנתח קטגוריה ואת האובייקטים המשתייכים אליה באופן כמותי, ולמדוד את סך התכונות המשותפות אל מול סך התכונות הנבדלות, כדי לעמוד על מה שעמוס טברסקי כינה 'דמיון קטגורי' 2. גישה זו משמשת כלי עבודה בחקר האינטליגנציה המלאכותית, ובניסיון ליצור תוכנות מחשב שיכולות 'לחשוב' כמו בני-אדם, ללמוד ולהסיק מסקנות, ולייצר ציפיות משמעותיות ביחס לסביבה.

הקטגוריזציה פועלת במידה רבה כמו מנועי-חיפוש, באמצעות Indexing, פעולת הסריקה והאיתור של אובייקטים מסוימים מתוך מאגר המידע הקיים, ה-Index. מנועי החיפוש נמדדים על פי היכולת שלהם לסרוק כמויות אדירות של מידע במינימום זמן. אופני הקידוד והעיבוד של מנועי החיפוש מהווים למעשה את המשאב העיקרי שלהם, ונשמרים בסודיות. ה-Indexing יכול לפעול באופן ישר, כך שעבור כל כתובת ברשת, יפורטו כל האובייקטים הכלולים באותה הכתובת; או באופן מהופך, כך שעבור כל אובייקט יפורטו כל הכתובות ברשת המכילות אותו.

מעבר לכך, על מנועי החיפוש להתמודד עם בעיות כגון הוספה מתמשכת של פריטים למאגרי המידע, גודלו של ה-Index, מהירות החיפוש ועוד. בעיות אלו רלבנטיות במידה רבה גם לקטגוריזציה שאנחנו מבצעים במוחנו.

בשנות ה-70 של המאה הקודמת, החוקרת האמריקאית אלינור רוש (Rosch), פיתחה והרחיבה את תיאורית הקטגוריזציה. רוש התבססה על ההיגיון הכלכלי של הקטגוריזציה, ועל ההנחה הבסיסית כי העולם אותו אנחנו תופשים, אכן מאורגן באופן מסודר ושיטתי. על אף הריבוי של גירויים ומידע במציאות המורכבת סביבנו, ישנם ארגון וסדר בעולם. כך, למשל, יצור חי בעל נוצות, סביר כי יהיה בעל היכולת לעוף, לעומת יצור חי בעל פרווה, שסביר להניח שלא יהיה מסוגל לעוף. כאשר ניסתה למצוא תשובה באשר לאופטימליות של הקטגוריזציה, גילתה כי קיימות קטגוריות טבעיות, וכי לכל קטגוריה ישנו פרוטוטיפ, אבטיפוס, המאפשר היסק מקסימלי.

רוש שאלה, למשל, האם שיער אדום שייך לקטגוריה 'אדום' באותה מידה משאית כיבוי-אש אדומה שייכת אליה? או מה קורה במקרים חריגים, כגון ציפור שחסרה את התכונה של 'מסוגלות-לעוף'? נדמה שציפור כזו אינה מקיימת מאפיין מרכזי ומהותי בקטגוריה שאליה היא משתייכת, התיאוריה של רוש מנסה ליישב בעייתיות מסוג זה, של מידת השתייכות מדורגת לקטגוריה, ושל מאפיינים מובהקים לחברים בה 3.

רוש מתארת את פעולת הקטגוריזציה כמורכבת משני צירים של הכללה: אנכי ואופקי. בציר האנכי ניצבות זו מעל זו קטגוריות המוכלות זו בזו, כמו הקטגוריות לברדור, כלב, יונק, בעל חיים ויצור חי. בציר האופקי ניצבות זו לצד זו, קטגוריות שונות שאינן מכילות את זולתן, כמו כלב, מכונית, אדום וכו'. על ידי ניסויים רבים, הוכיחה רוש כי אצל אנשים שהתפתחו בסביבה נורמלית, במגוון תרבויות בעולם, קיימות קטגוריות טבעיות, הנפרדות זו מזו באופן היעיל ביותר, כך שיש לכל אחת מהן מאפיינים/תכונות משותפים מעטים ככל האפשר.

ציפור מתכת

"ציפור מתכת", תצלום: מרטין נאיינהויס.

הקטגוריות הטבעיות הן אלו שמצליחות לאגד תכונות משותפות רבות ככל האפשר לחברים בקטגוריה. מעבר לכך, במעבר לרמה גבוהה או נמוכה יותר של הפשטה מהקטגוריות הטבעיות, כמות המידע או יכולת ההיסק פוחתות. רוש מצאה כי קטגוריות טבעיות הן קטגוריות שמכילות פריטים רבים ככל האפשר, שלחברים בהן יש תכונות משותפות רבות ככל האפשר, הן מקודדות באופן הנרחב ביותר בשפה, הן הראשונות שמצוינות על ידי ילדים וכו'. המשחק המוכר והנפוץ 'ארץ, עיר, חי, צומח, דומם' מהווה דוגמה טובה לקטגוריות טבעיות.

בנוסף לכך, לכל קטגוריה, כאמור, ישנו פרוטוטיפ, אובייקט עשיר במידע ומובחן במידה מרבית. הפרוטוטיפ מכיל כמה שיותר מאפיינים משותפים לחברים האחרים בקטגוריה, וכמה שפחות מאפיינים משותפים עם קטגוריות אחרות. כך הוא מאפשר היסק מהיר וחסכוני יחסית אודות אובייקטים אחרים בהשוואה אליו. זה כמובן מה שמאפשר את הבנתן של בדיחות על עדות ועמים שונים, וגם את הפצתם של רעיונות פוליטיים מסוגים שונים, דעות קדומות וסטריאוטיפים.

הפרוטוטיפ מכיל מאפיינים מובהקים, אשר מחקרים בפסיכולוגיה התפתחותית הוכיחו כי הם ידועים לנו באופן אינטואיטיבי. ניסויים הוכיחו כי תינוקות בגיל חצי שנה כבר יודעים כי אובייקט מוצק לא יכול לעבור דרך אובייקט מוצק אחר 4.

ניתן להבין את קיומן של קטגוריות טבעיות ושל פרוטוטיפים, גם בהקשר של המעמסה הקוגניטיבית על הזיכרון. מדוע אין לנו קטגוריה עצמאית עבור 'כיסא עץ לבן בעל משענת מרובעת ומסעדים מעוגלים'? אם ניצור קטגוריות ברמות הכללה כה נמוכות, נהיה זקוקים לאוסף רחב בהרבה של קטגוריות כדי לתאר את הסביבה, זה עלול להוות עול על הזיכרון הסמנטי שלנו. כלומר, הקטגוריות נבדלות זו מזו על פי היעילות הכלכלית, ובהתאם לעולם המאורגן באופן מובנה בעצמו.

מחקרים נוספים פיתחו את התיאוריה של הקטגוריזציה, ויצרו טקסונומיה אונטולוגית, כלומר קטגוריזציה עבור מכלול האובייקטים האפשריים הקיימים 5. כך הוגדרו יחסי ההכלה בין הקטגוריות הטבעיות הבסיסיות ביותר שמצאה רוש: ישות במרחב, עצם מוצק, יצור חי, בעל-חיים ואדם. עבור כל קטגוריה, ישנן תכונות מובהקות, הידועות באופן אינטואיטיבי. כך כל תינוק יודע שעצמים מוצקים אינם חדירים, וכל ילד יודע שיצורים חיים מתפתחים, מתבגרים וגדלים, ולא הופכים צעירים וקטנים יותר.

מובן שבכל הנוגע לקטגוריות מופשטות כגון יופי, צדק וחמלה, השיוך של אובייקטים שונים אליהן מורכב ומסובך הרבה יותר, ותלוי מאוד בהקשר ובסביבה, אך ניתן בהחלט לשער כי מנגנון הפעולה הבסיסי לא משתנה. המפגש הבלתי-פוסק שלנו עם גירויים מן הסביבה יוצר הפעלה מתמדת של מנגנון הקטגוריזציה, והניסיון המצטבר שלנו מעצב את גבולותיהן של הקטגוריות באופן דינמי. אנחנו 'מריצים' אלגוריתמים באופן אוטומטי בראשנו, סורקים את מאגר הידע שלנו ואת ה-Index שלנו, כדי לקבל החלטות ולפעול.

כלומר, גם כאשר אנחנו עומדים בפני מצב רגשי מורכב, שיקול הדעת והשיפוט שלנו, המבוססים על הידע שלנו על העולם, באים לידי ביטוי על ידי פעולת הקטגוריזציה. כאשר אנחנו מתלבטים כיצד לנהוג, אנחנו משייכים אובייקטים לקטגוריות, משווים בין האובייקטים לפרוטוטיפ של אותה הקטגוריה, יוצרים קטגוריות חדשות, ומבצעים השוואות בין הקטגוריות החדשות שיצרנו לבין קטגוריות מוכרות.

'ידע הוא כוח', אך גם אופן הארגון של ידע הוא כוח, ואף כוח כלכלי. כך עבור הצייד-הלקט וכך גם עבור צאצאו המצויד בטלפון-חכם. האם העובדה שאנחנו יצורים כלכליים במהותנו היא חדשה, או מוזרה או מיוחדת? הרי התחרות על ההישרדות ברורה וידועה. לכן רק טבעי, שכפי שמערכת העיכול שלנו, והמערכת החיסונית פועלות באופן חסכוני ויעיל, גם מוחנו יעבד את הסביבה שלנו באופן שכזה.

האם מכאן עולה, כי אנחנו מתוכנתים באופן מסוים, תת-מודע, כך שאין לנו חופש מחשבה ורגש כפי שאנחנו מאמינים? או אולי אנחנו 'סוג-של' מתוכנתים, 'כמעט' מתוכנתים, מתוכנתים 'בערך'?

 

מאמר זה התפרסם באלכסון ב

תגובות פייסבוק

> הוספת תגובה

6 תגובות על צייד לקט ומתוכנת

01
איתי

תומר, הרגש הוא מעל לכל והוא בוחר את הקטגוריה ולא הקטרגוריזציה ממיינת את הרגש, כי רגשזה דבר משתנה ויכול להרגיש יותר מקטגוריה בו זמנית(שונא/אוהב, שנאה/קנאה וכו...).

    02
    תומר וינר

    יכול להיות שהרגש הוא 'מעל לכל', מבחינת הדרך שבה אנחנו תופסים את המציאות, אבל במאמר הזה נשאלת השאלה כיצד אנחנו 'יודעים' מה זה רגש, ומהם סוגי הרגשות השונים? התאוריה של הקטגוריזציה מתייחסת גם לרגשות - כמו לכל המושגים - כאל קטגוריה מסוימת, שבעצמה נחלקת לעוד קטגוריות משנה. רגש הוא קטגוריה שונה מזיכרון ומשיקול-דעת, למרות שאלו כולן תופעות 'נפשיות', מנטאליות. כך גם כעס הוא קטגוריה השונה מקנאה ומשנאה. מעניין לבדוק היכן עוברים הגבולות בין הקטגוריות השונות, הטענה של החוקרים היא כי אלו גבולות 'טבעיים', מולדים אצל בני-אדם, שמראש 'מתוכנתים' לחלק את כל הידע שלנו לקטגוריות, ויותר מכך, לקטגוריות מסוימות קבועות.

03
בר טוביה

קראתי 5 שורות ראשונות ונראה לי מעניין אז המשכתי. השורות הבאות כללו מידע שלא חשבתי עליו קודם אז המשכתי . נראה לי שזה אכן מאשר שאני שבוי לחשוב בצורה כלכלית... האם המוח "מסדר" אותנו? ומצד שני מה עם חופש הרצון? אשמח למאמר המשך בנושא...