מדען אורח פרופ' ליאור רוקח

מהי, לדעתך, פריצת הדרך המשמעותית או המסקרנת ביותר שנעשתה בתחום המחקר שלך בשנים האחרונות?

התחום של למידת מכונה (Machine Learning), שהוא כבן שלושים שנה, נועד ללמד מערכת מחשב לבצע מטלה מסוימת מתוך דוגמאות או ניסיון קודם. למעשה, כולנו כבר נהנים כיום מביצועי המערכות הלומדות במגוון תחומים. באמצעותן, למשל, יוטיוב יודע להמליץ לנו על סרטונים בהם כדאי לנו לצפות, וגוגל מנתחת אילו מיילים אנו זורקים לאשפה ללא פתיחה ומתוך כך לומדת לשלוח את דומיהם לתיקיית הספאם באופן עצמאי, מבלי להטריד אותנו.
פריצת הדרך החשובה בתחום בשנים האחרונות, הוא הרעיון של Transfer Learning שהחל ב- 2005 ובו אנו מאפשרים למחשב להשתמש בידע שהוא למד מביצוע מטלה מסוימת, כדי לבצע מטלה אחרת. למשל, מחקר שבוצע על ידינו לאחרונה על מערכות המלצה, הראה כי מהאופן שבו למדה המערכת אילו סרטים המשתמש אוהב, היא יכולה להמליץ לו על משחקי מחשב. ומשם זה יכול להתפתח גם לתחומים שנראים פחות דומים: מההעדפות בסרטים ניתן להסיק על העדפות במוסיקה, באוכל ועוד.
ההנחה היא שקיים מכנה משותף בין משימות שונות, שבאמצעותו ניתן לבצע את ההעברה ממשימה אחת לשנייה. ממש כפי שמערכת התפישה האנושית נעזרת בקיצורי דרך קוגניטיביים (כגון סטריאוטיפיים), כך גם Transfer Learning בונה מערכת של סכמות שהן קיצורי דרך. בנוסף, מערכת למידה מלאכותית יכולה בנקל לשתף ניסיון של הרבה אנשים בעוד שמערכת הלמידה האנושית נסמכת יותר על ניסיון חייו של האינדיבידואל (כך קורה שילדים נאלצים "ללמוד על בשרם" לעיתים, דברים שכבר נלמדו על ידי אנשים אחרים).

מהם המחקרים שמעסיקים אותך בתקופה זו?

מערכות המלצה, עליהן דיברתי, מהוות את אחד המחקרים עליהם עמיתי ואני עובדים כיום. ניתוח טקסט מבוסס הקשר הוא נושא אחר. כיום יש כבר מערכות המנתחות סמנטיקה ויודעות לחלץ את הנימה וההקשר מתוך טקסטים חופשיים ולהעריך, למשל, האם טוקבקים הינם שליליים או חיוביים. זה לא כל כך טריוויאלי כפי שזה נשמע, כי המערכת צריכה להבין שימוש באירוניה וסרקזם וזה דורש עיבוד מורכב יותר.

השאיפה במחקר שלנו היא לחלץ מידע מתוך טקסט חופשי ולארגן אותו במבנה טבלאי. הפוטנציאל היישומי של כלי כזה הוא אדיר. קח לדוגמה חוקר ננו-חלקיקים שמעוניין לדעת אילו חלקיקים רעילים לגוף האדם ובאיזו מידה. הוא עומד בפני אלפי מאמרים הכתובים בטקסט חופשי ועכשיו הוא צריך להתחיל לקרוא ולחלץ מהם את המידע הדרוש. מערכת שתנתח ותארגן עבורו את הטקסט, תאפשר לו לבצע שאילתה פשוטה ולקבל תשובה על המקום.
תחום מרתק אחר, הוא יישומים של למידה חישובית באבטחת המידע. אנחנו יודעים כיום לזהות בני אדם לפי השימוש במקלדת המחשב שלהם, למשל, כך שהמערכת לא תאפשר לאף אדם אחר להשתמש במחשב שלך. למידת דפוסי השימוש נסמכת על מהירות ההקלדה, אופן המעבר בין מקשים מסוימים וזמן הלחיצה עליהם. מה שמעניין הוא, שהדפוסים הייחודיים הללו נשמרים בין אם אדם כותב תוכנה בעבודת ההייטק שלו ובין אם הוא כותב מכתב לחבר מהקריביים.
מחקר נוסף, בו אנו עוסקים בשש השנים האחרונות והוא כיום מהמובילים בעולם בתחום, הוא התמודדות מול תקיפה של תוכנות זדוניות (וירוסים, סוסים טרויאנים וכיו"ב). אנו יודעים שהתוקפים משנים כל הזמן את דפוס העבודה שלהם ועד היום ההתמודדות הייתה בעיקרה כדלהלן: יושב אנליסט שמנסה לחלץ את החתימה הספציפית של התוכנה הזדונית ואז עליו לתכנת "נוגדן" מתאים בתוכנת האנטי-וירוס המתעדכנת תדיר. הבעיה היא, שזה תהליך שגוזל הרבה זמן וכסף. המחקר שלנו שואף לייתר את הגורם האנושי ולהציב מכונה מול מכונה, כלומר מערכת שתאתר מכנה משותף רחב דיו בתוכניות הזדוניות, כך שהיא תדע לזהות גם תכנית זדונית חדשה שלא ראינו בעבר בהתאם למאפייניה ולהתנהגות שלה. זו למידה שאף אדם לא יכול לעמוד בקצב שלה.

כיצד אתה רואה את העתיד של תחום המחקר שלך?

אין ספק ששילובן של המערכות הלומדות בחיינו צפוי לגדול, ככל שאיסוף המידע יגבר במקביל לזמינות הכוח החישובי. בעתיד הקרוב, אני סבור, למשל, שכוח החישוב של הטלפונים הסלולריים יאפשר להם להיות סוכן אישי חכם שילמד את בעליו, יסיק מסקנות ויצטייד בכלים שיהפכו אותו לעוזר אישי. סוכן כזה יוכל, למשל, להציע לך מה לעשות בזמנך הפנוי (ולקלוע במגוון פרמטרים, כמו טעם, זמינות, קרבה פיסית), לערוך עבורך קניות לאחר שביצע סקר שוק, לתקשר עם סוכנים ממוחשבים המייצגים אנשים אחרים (למשל כדי לתאם פגישות) ועוד.
צריך להבין שעיקר המאמץ בעבר התמקד בללמד את המחשב לבצע משימות המוגדרות היטב ואשר נלמדות בנפרד ובצורה בלתי תלויה מהמשימות האחרות. אבל הלמידה האנושית אינה פועלת כך ואין סיבה שגם המכונות שלנו יפעלו כך. תחום הלמידה החישובית הולך בכיוון של "גידול מחשבים" (על משקל "גידול ילדים"), המאפשר למכונה להרחיב עוד ועוד את בסיס הלמידה באמצעות משימות חדשות. פרויקט למידת השפה (Never Ending Language Learning) של אוניברסיטת CMU היא דוגמא טובה לכך.

מהו ההסבר האלגנטי, העמוק או היפה ביותר בעיניך לתופעה כלשהי?

כבר לפני 280 שנה חקר דייוויד יוּם את מושג הסיבתיות הנובע מיחס בין אובייקטים, וגרם לנו להבין שהמדע אינו יכול לתת ערבויות על תוצאות עתידיות בהתבסס על תוצאות העבר. הטענה של יוּם נוגדת את התקווה הפוזיטיביסטית שבטווח הרחוק יהיה ניתן למצוא מודל מדעי כולל שיסביר וינבא הכל. והנה, בשנת 1996, עיקרון זה הוכח מתמטית, עבור למידת מכונה, על ידי החוקר דיויד וולפרט. מדובר בהוכחה אלגנטית להפליא, ממנה נובע עיקרון ה"No Free Lunch" (אין ארוחות חינם). על פי עקרון זה, לא ייתכן מודל למידה אחד שיהיה אופטימאלי לכל המשימות, וזאת משום שכל אלגוריתם סובל מהטיות הקשורות לאופן בו הוא מכליל מתוך דוגמאות העבר.

לגבי מה אתה אופטימי?

ישנם הטוענים כי ההתקדמות הטכנולוגית עלולה להביא לניוון המוח האנושי. טענות אלה הן חלק ממסורת קונפורמיסטית ארוכת ימים של נביאי זעם המזהירים אותנו מפני ההשלכות ההרסניות של טכנולוגיה זו או אחרת: השימוש במחשבון פוגע ביכולות החישוב בעל פה; השימוש בGPS משכיח מאתנו את שמות הרחובות; אנחנו סומכים על זמינות המידע דרך מנועי חיפוש באינטרנט במקום לשנן אותו בראשינו וכולי. פעם בכמה זמן קם גם סופר מד"ב שמציג, בתמונת עולם דיסוטופית, את כל הרעות החולות המצפות לנו בעקבות הטכנולוגיה.
אני חושב שאיש אינו יכול לחזות את ההשלכות ארוכות הטווח האמיתיות של רוב ההתפתחויות הטכנולוגיות, והקביעה מראש כי הן תהיינה שליליות, נראית לי פסימית מדי. אני דווקא חושב שבמקום "לבזבז" את הזמן בביצוע מטלות שגרתיות, הקדמה הטכנולוגית מְפנה משאבים קוגניטיביים ומאפשרת לנו להתמקד בחשיבה מופשטת ויצירתית. למעשה, הכוח החישובי ומאגרי המידע העצומים שקיימים כיום יהפכו להיות הרחבה ישירה של המוח האנושי (דמיין עולם שבו, למשל, כל בן אנוש "זוכר" את כל ה-Wikipedia בעל פה). הממשק בין האדם והמכונה צריך לעבור עוד מהפכה כמובן, אך ניצניה נראים כבר היום בתחום של ממשקי אדם-מכונה.

מחשבה זו התפרסמה באלכסון ב


תגובות פייסבוק

2 תגובות על פרופ' ליאור רוקח

01
ניר

השלכות ארוכות טווח:
חלק מהטכנולוגיות שליאור מזכיר קיימות כבר כבר אלפי שנים , אבל ביצוען לא היה על ידי מכונות אלא על ידי אנשים: ל"סוכן אישי חכם" קראו מזכיר / לבלר ול GPS קראו "נהג צמוד" ושאר סוגי עיסוקים של עובדים או עבדים ששיחררו אותם ממטלות יומיומיות . אבל אלו היו "כלים" שרק מועטים זכו להם. מהפילוסופים היוונים ועד למדענים של המאה ה20 החזיקו עוזרים בצורה כזאת או אחרת, כמעט כולם, היו יוצאים מן הכלל.
הטכנולוגיה מאפשרת עזרים כאלו במחיר שווה לכל נפש לכולנו. נוכל להתרכז בכתיבת שירה, הגות פילוסופית, או גרימת נזקים, תלוי רק בנו: את העבודה השחורה נשאיר למכונות ולסוכנים החכמים.

02
אילנה

הכל טוב ויפה - אבל בפועל העזרה שאנו צריכים בחיי היום-יום זה לא סוכן אישי, אלא רחיצת כלים, ניקיון אבק , סחיבת מוצרים מהסופרמרקט , קיפול כביסה וכולי וכולי. לא חושבת שזה השתנה ב-30 שנים האחרונות.

נקודה נוספת - ועוד יותר חשובה - טכנולוגיה במקום עובדים מומחים - מביאה למיליוני אנשים מובטלים (מתחילים לראות את זה היום בכל המערב ), ואנשים פשוטים שעושים עבודות "פשוטות" כמו ניקיון , בשכר רעב.
זה אדיר שתוכנה יכולה להחליף מישהו - אבל המישהו הזה יישאר בלי עבודה !