המחשב כתולעת ספרים

אילו תובנות עולות ממחשב המזהה רגשות בסיפורים?
X זמן קריאה משוער: 3 דקות

 בשלהי 2005 הוזמן היסטוריון המדע ג'ורג' דייסון למעבדות גוגל כדי להתרשם מהפרויקט בן השנה, Google Books. השאיפה של החברה להנגיש מיליוני ספרים (נכון לאפריל 2013, למעלה משלושים מיליון הועלו לרשת) לאזרחי העולם לצורך קריאה וחיפוש הרְשימה את דייסון, אולם בשיחה עם אחד ממארחיו הוא קיבל רושם קצת אחר באשר לכוונותיה של גוגל. "איננו סורקים את כל הספרים האלה כדי שיקָרְאו על ידי אנשים", אמר המהנדס, "אנחנו סורקים אותם כדי שיקָרְאו על ידי אינטליגנציה מלאכותית", ככל הנראה כדי לפתח מנוע חיפוש סמנטי.

ניתוח סמנטי של טקסטים החל מספר שנים לפני שפרויקט Google Books יצא לדרך אבל אפשר לומר שהוא עדיין בחיתוליו. פיענוח השפה האנושית הוא אתגר עצום עבור מפתחי אלגוריתם, והוא צופן שלל מכשולים כמו עמימות, סתירות לוגיות, אירוניה, אנלוגיות ועוד. גם לאחר תהליך מורכב של למידה חישובית בו מדענים הצליחו לפתח אינטליגנציה של מחשב שתשתווה למנת משכל של ילד בן 4, בכל הקשור לפיענוח עמוק של שפה ההתקדמות היא איטית למדי ועוד לא נראה באופק היום בו נוכל להציג ל- Google Books שאילתות סמנטיות מורכבות.

ואף על פי כן, ישנה התקדמות מעניינת בתחום ואחד האתגרים עליהם מחקרים רבים שמים את הדגש בשנים האחרונות, הוא פענוח רגשות. זאת בעיקר בשל הפוטנציאל המסחרי והפוליטי העצום הטמון ביכולת לאבחן התייחסויות חיוביות או שליליות באתרי חדשות (כולל הטוקבקים), קבוצות דיון, בלוגים והרשתות החברתיות. מחקר שהתפרסם לאחרונה על ידי המוסד לאינפורמציה טכנולוגית של National Research Council Canada, התמקד לא רק בפיענוח הנימה כשלילית או חיובית, אלא גם באיתור מגוון רחב יחסית של רגשות: שמחה, אמון, פחד, הפתעה, עצב, גועל, כעס וציפיה. סאיף מוחמד החתום על המחקר, השתמש בחוכמת המונים כדי לייצר לקסיקון שלם לכל אחד מהרגשות הללו. עשרות אלפי משתתפים סיפקו מעל מיליון תשובות לגבי אילו מילים מתקשרות סמנטית לאילו רגשות (וזאת לאחר וידוא כי המשתתפים מבינים היטב את המושגים וניפוי שיטתי של אלה שסיפקו תשובות שגויות). הלקסיקון שגובש שימש כדי "לאמן" מחשב בזיהוי הרגשות באוסף רחב של רומנים ואגדות מתוך מאגר Google Books.

כאשר הגיע מוחמד לדיוק גבוה בזיהוי סוגי הרגשות, הוא החל להריץ מגוון של ניתוחים והשוואות. אגדות, למשל, נמצאו כמכילות הרבה יותר רגשות, באופן כללי, בהשוואה לרומנים. אפשר היה גם למקם את היצירות על ספקטרום רגשי ולאפיין את מצב הרוח הכללי העולה מהן. שלא במפתיע, לדוגמה, האגדה "סינדרלה" התאפיינה ברגשות שמחים יותר יחסית לאגדה האפלולית "סנדק המוות" (שתיהן של האחים גרים), ופערים מתבקשים דומים נמצאו גם בהשוואה בין טרגדיות לקומדיות מאת שייקספיר.

גם אם בינתיים ניתוח ממוחשב מעין זה נדמה עקר ורחוק מאוד מהבנה ספרותית אמיתית, הוא בכל זאת עשוי להצליח לספק תובנות מעניינות. בין הראשונים שיעידו על כך, הוא וודאי הסופר ארנון גרונברג, שזכה בתחרות ספרותית בהולנד עבור ספרו הראשון ב- 1994, ופעם נוספת עבור ספרו השני ב- 2000 תחת הפסבדונים מארק ון דר יאכט. למרות החשדות שעלו בעקבות הסגנונות הדומים בין שני הספרים, גרונברג הכחיש בתוקף כי הוא עצמו מארק ון דר יאכט, עד שבלשן איטלקי השתמש באלגוריתם שפיתח על מנת לערוך השוואה שיטתית בין הטקסטים, וגרונברג הפך רשמית לסופר הראשון והאחרון, שזכה פעמיים בפרס המוענק לספר ביכורים.

זו כמובן רק אנקדוטה, אבל היא מבהירה כי היכולת לערוך ניתוח סמנטי, גם אם בסיסי למדי, עשויה לסייע בתכנון מחקרים גם מחוץ לפקולטה למדעי המחשב. למשל, במדעי החברה. "אנחנו יכולים כיום לנטר את התמורות ברגשות הקשורים לישות מסוימת כמו מדינה או קבוצה פוליטית, על ידי בדיקת ההתייחסויות לאותה ישות במיליוני ספרים שפורסמו במשך כמה מאות שנים", מסביר מוחמד למגזין הטכנולוגי SingularityHub.com. מחקרו אכן עשה ניסיון צנוע ובדק את ההתייחסות הרגשית למילים "אמריקה", "הודו", "גרמניה" ו"סין" מאז שנת 1800. התוצאות התאימו לתמורות ההיסטוריות הגלובליות שהתרחשו בעולם בתקופה זו. מחקרים קודמים הדגימו כי ניתן אף להגביר את הרזולוציה ולייחס משמעויות רגשיות גם לנושאים ספציפיים בטקסט מבלי להזינם מראש.

גם מדעי הרוח עשויים ליהנות מפיתוח אלגוריתם מהסוג הזה. חוקרי ספרות, למשל, עשויים לגשש אחר תמורות רגשיות בקורפוס של סופר מסוים או קבוצת סופרים. אמנם אין לתלות תקוות כי בעתיד מחשבים יצליחו להשלים את המשימה ולכתוב גם את עבודת התזה, אבל מדד סמנטי-כמותי בהחלט עשוי לספק רעיונות לשאלות מחקר חדשות או לחזק ניתוח עמוק של טקסטים.

מקורות"החל מ'היה היה' ועד 'באושר ואושר עד עצם היום הזה': ניטור רגשות ברומנים ובאגדות"- המחקר של סאיף מוחמד."אלגוריתם עוקב אחר רגשות אצל שייקספיר והאחים גרים"- כתבה וראיון עם סאיף מוחמד ב- SingularityHub

מחשבה זו התפרסמה באלכסון ב


תגובות פייסבוק