מהי, לדעתך, פריצת הדרך המשמעותית או המסקרנת ביותר שנעשתה בתחום המחקר שלך בשנים האחרונות?
התחום של למידת מכונה (Machine Learning), שהוא כבן שלושים שנה, נועד ללמד מערכת מחשב לבצע מטלה מסוימת מתוך דוגמאות או ניסיון קודם. למעשה, כולנו כבר נהנים כיום מביצועי המערכות הלומדות במגוון תחומים. באמצעותן, למשל, יוטיוב יודע להמליץ לנו על סרטונים בהם כדאי לנו לצפות, וגוגל מנתחת אילו מיילים אנו זורקים לאשפה ללא פתיחה ומתוך כך לומדת לשלוח את דומיהם לתיקיית הספאם באופן עצמאי, מבלי להטריד אותנו.
פריצת הדרך החשובה בתחום בשנים האחרונות, הוא הרעיון של Transfer Learning שהחל ב- 2005 ובו אנו מאפשרים למחשב להשתמש בידע שהוא למד מביצוע מטלה מסוימת, כדי לבצע מטלה אחרת. למשל, מחקר שבוצע על ידינו לאחרונה על מערכות המלצה, הראה כי מהאופן שבו למדה המערכת אילו סרטים המשתמש אוהב, היא יכולה להמליץ לו על משחקי מחשב. ומשם זה יכול להתפתח גם לתחומים שנראים פחות דומים: מההעדפות בסרטים ניתן להסיק על העדפות במוסיקה, באוכל ועוד.
ההנחה היא שקיים מכנה משותף בין משימות שונות, שבאמצעותו ניתן לבצע את ההעברה ממשימה אחת לשנייה. ממש כפי שמערכת התפישה האנושית נעזרת בקיצורי דרך קוגניטיביים (כגון סטריאוטיפיים), כך גם Transfer Learning בונה מערכת של סכמות שהן קיצורי דרך. בנוסף, מערכת למידה מלאכותית יכולה בנקל לשתף ניסיון של הרבה אנשים בעוד שמערכת הלמידה האנושית נסמכת יותר על ניסיון חייו של האינדיבידואל (כך קורה שילדים נאלצים "ללמוד על בשרם" לעיתים, דברים שכבר נלמדו על ידי אנשים אחרים).
מהם המחקרים שמעסיקים אותך בתקופה זו?
מערכות המלצה, עליהן דיברתי, מהוות את אחד המחקרים עליהם עמיתי ואני עובדים כיום. ניתוח טקסט מבוסס הקשר הוא נושא אחר. כיום יש כבר מערכות המנתחות סמנטיקה ויודעות לחלץ את הנימה וההקשר מתוך טקסטים חופשיים ולהעריך, למשל, האם טוקבקים הינם שליליים או חיוביים. זה לא כל כך טריוויאלי כפי שזה נשמע, כי המערכת צריכה להבין שימוש באירוניה וסרקזם וזה דורש עיבוד מורכב יותר.
השאיפה במחקר שלנו היא לחלץ מידע מתוך טקסט חופשי ולארגן אותו במבנה טבלאי. הפוטנציאל היישומי של כלי כזה הוא אדיר. קח לדוגמה חוקר ננו-חלקיקים שמעוניין לדעת אילו חלקיקים רעילים לגוף האדם ובאיזו מידה. הוא עומד בפני אלפי מאמרים הכתובים בטקסט חופשי ועכשיו הוא צריך להתחיל לקרוא ולחלץ מהם את המידע הדרוש. מערכת שתנתח ותארגן עבורו את הטקסט, תאפשר לו לבצע שאילתה פשוטה ולקבל תשובה על המקום.
תחום מרתק אחר, הוא יישומים של למידה חישובית באבטחת המידע. אנחנו יודעים כיום לזהות בני אדם לפי השימוש במקלדת המחשב שלהם, למשל, כך שהמערכת לא תאפשר לאף אדם אחר להשתמש במחשב שלך. למידת דפוסי השימוש נסמכת על מהירות ההקלדה, אופן המעבר בין מקשים מסוימים וזמן הלחיצה עליהם. מה שמעניין הוא, שהדפוסים הייחודיים הללו נשמרים בין אם אדם כותב תוכנה בעבודת ההייטק שלו ובין אם הוא כותב מכתב לחבר מהקריביים.
מחקר נוסף, בו אנו עוסקים בשש השנים האחרונות והוא כיום מהמובילים בעולם בתחום, הוא התמודדות מול תקיפה של תוכנות זדוניות (וירוסים, סוסים טרויאנים וכיו"ב). אנו יודעים שהתוקפים משנים כל הזמן את דפוס העבודה שלהם ועד היום ההתמודדות הייתה בעיקרה כדלהלן: יושב אנליסט שמנסה לחלץ את החתימה הספציפית של התוכנה הזדונית ואז עליו לתכנת "נוגדן" מתאים בתוכנת האנטי-וירוס המתעדכנת תדיר. הבעיה היא, שזה תהליך שגוזל הרבה זמן וכסף. המחקר שלנו שואף לייתר את הגורם האנושי ולהציב מכונה מול מכונה, כלומר מערכת שתאתר מכנה משותף רחב דיו בתוכניות הזדוניות, כך שהיא תדע לזהות גם תכנית זדונית חדשה שלא ראינו בעבר בהתאם למאפייניה ולהתנהגות שלה. זו למידה שאף אדם לא יכול לעמוד בקצב שלה.
כיצד אתה רואה את העתיד של תחום המחקר שלך?
אין ספק ששילובן של המערכות הלומדות בחיינו צפוי לגדול, ככל שאיסוף המידע יגבר במקביל לזמינות הכוח החישובי. בעתיד הקרוב, אני סבור, למשל, שכוח החישוב של הטלפונים הסלולריים יאפשר להם להיות סוכן אישי חכם שילמד את בעליו, יסיק מסקנות ויצטייד בכלים שיהפכו אותו לעוזר אישי. סוכן כזה יוכל, למשל, להציע לך מה לעשות בזמנך הפנוי (ולקלוע במגוון פרמטרים, כמו טעם, זמינות, קרבה פיסית), לערוך עבורך קניות לאחר שביצע סקר שוק, לתקשר עם סוכנים ממוחשבים המייצגים אנשים אחרים (למשל כדי לתאם פגישות) ועוד.
צריך להבין שעיקר המאמץ בעבר התמקד בללמד את המחשב לבצע משימות המוגדרות היטב ואשר נלמדות בנפרד ובצורה בלתי תלויה מהמשימות האחרות. אבל הלמידה האנושית אינה פועלת כך ואין סיבה שגם המכונות שלנו יפעלו כך. תחום הלמידה החישובית הולך בכיוון של "גידול מחשבים" (על משקל "גידול ילדים"), המאפשר למכונה להרחיב עוד ועוד את בסיס הלמידה באמצעות משימות חדשות. פרויקט למידת השפה (Never Ending Language Learning) של אוניברסיטת CMU היא דוגמא טובה לכך.
מהו ההסבר האלגנטי, העמוק או היפה ביותר בעיניך לתופעה כלשהי?
כבר לפני 280 שנה חקר דייוויד יוּם את מושג הסיבתיות הנובע מיחס בין אובייקטים, וגרם לנו להבין שהמדע אינו יכול לתת ערבויות על תוצאות עתידיות בהתבסס על תוצאות העבר. הטענה של יוּם נוגדת את התקווה הפוזיטיביסטית שבטווח הרחוק יהיה ניתן למצוא מודל מדעי כולל שיסביר וינבא הכל. והנה, בשנת 1996, עיקרון זה הוכח מתמטית, עבור למידת מכונה, על ידי החוקר דיויד וולפרט. מדובר בהוכחה אלגנטית להפליא, ממנה נובע עיקרון ה"No Free Lunch" (אין ארוחות חינם). על פי עקרון זה, לא ייתכן מודל למידה אחד שיהיה אופטימאלי לכל המשימות, וזאת משום שכל אלגוריתם סובל מהטיות הקשורות לאופן בו הוא מכליל מתוך דוגמאות העבר.
לגבי מה אתה אופטימי?
ישנם הטוענים כי ההתקדמות הטכנולוגית עלולה להביא לניוון המוח האנושי. טענות אלה הן חלק ממסורת קונפורמיסטית ארוכת ימים של נביאי זעם המזהירים אותנו מפני ההשלכות ההרסניות של טכנולוגיה זו או אחרת: השימוש במחשבון פוגע ביכולות החישוב בעל פה; השימוש בGPS משכיח מאתנו את שמות הרחובות; אנחנו סומכים על זמינות המידע דרך מנועי חיפוש באינטרנט במקום לשנן אותו בראשינו וכולי. פעם בכמה זמן קם גם סופר מד"ב שמציג, בתמונת עולם דיסוטופית, את כל הרעות החולות המצפות לנו בעקבות הטכנולוגיה.
אני חושב שאיש אינו יכול לחזות את ההשלכות ארוכות הטווח האמיתיות של רוב ההתפתחויות הטכנולוגיות, והקביעה מראש כי הן תהיינה שליליות, נראית לי פסימית מדי. אני דווקא חושב שבמקום "לבזבז" את הזמן בביצוע מטלות שגרתיות, הקדמה הטכנולוגית מְפנה משאבים קוגניטיביים ומאפשרת לנו להתמקד בחשיבה מופשטת ויצירתית. למעשה, הכוח החישובי ומאגרי המידע העצומים שקיימים כיום יהפכו להיות הרחבה ישירה של המוח האנושי (דמיין עולם שבו, למשל, כל בן אנוש "זוכר" את כל ה-Wikipedia בעל פה). הממשק בין האדם והמכונה צריך לעבור עוד מהפכה כמובן, אך ניצניה נראים כבר היום בתחום של ממשקי אדם-מכונה.
תגובות פייסבוק
2 תגובות על פרופ' ליאור רוקח
השלכות ארוכות טווח:
חלק מהטכנולוגיות שליאור מזכיר קיימות כבר כבר אלפי שנים , אבל ביצוען לא היה על ידי מכונות אלא על ידי אנשים: ל"סוכן אישי חכם" קראו מזכיר / לבלר ול GPS קראו "נהג צמוד" ושאר סוגי עיסוקים של עובדים או עבדים ששיחררו אותם ממטלות יומיומיות . אבל אלו היו "כלים" שרק מועטים זכו להם. מהפילוסופים היוונים ועד למדענים של המאה ה20 החזיקו עוזרים בצורה כזאת או אחרת, כמעט כולם, היו יוצאים מן הכלל.
הטכנולוגיה מאפשרת עזרים כאלו במחיר שווה לכל נפש לכולנו. נוכל להתרכז בכתיבת שירה, הגות פילוסופית, או גרימת נזקים, תלוי רק בנו: את העבודה השחורה נשאיר למכונות ולסוכנים החכמים.
הכל טוב ויפה - אבל בפועל העזרה שאנו צריכים בחיי היום-יום זה לא סוכן אישי, אלא רחיצת כלים, ניקיון אבק , סחיבת מוצרים מהסופרמרקט , קיפול כביסה וכולי וכולי. לא חושבת שזה השתנה ב-30 שנים האחרונות.
נקודה נוספת - ועוד יותר חשובה - טכנולוגיה במקום עובדים מומחים - מביאה למיליוני אנשים מובטלים (מתחילים לראות את זה היום בכל המערב ), ואנשים פשוטים שעושים עבודות "פשוטות" כמו ניקיון , בשכר רעב.
זה אדיר שתוכנה יכולה להחליף מישהו - אבל המישהו הזה יישאר בלי עבודה !
אמני תשומת הלב
מארק גרייףגיבורי התרבות האמריקניים בימי המלחמה הקרה לא הצליחו בזכות חזון ומטרה, אלא...
X רבע שעה
תקלה בעברית
לפעמים הכול נראה ונשמע בסדר, ובכל זאת – לא.
השורש העברי "תקל" הוא שורש ותיק ומבוסס. הפעלים ושמות העצם הבנויים עליו מוכרים לנו היטב: "תקלה", "להיתקל", "נתקל" וגם "תָקוּל". אלא שהשפה אינה רק מפרט של חלקים וחלקיקים העומדים לרשות הדוברים. המילון, כבר למדנו, אינו אלא פיקציה, שלכל היותר מראה אפשרויות תוך כיווץ ממד הזמן וגם התעלמות מקובלת משגרת השימוש. זאת אפשר לומר על המילון עוד לפני שבאים חשבון עם הבחירה מה להשמיט ממנו, כיצד להגדיר את הפריטים הכלולים בו ועוד. לכן נשים את המילון בצד, לפחות כאן, אם כי העצה טובה כמעט תמיד.
אז מה לא בסדר? איפה התקלה? השורש "תקל" הוא עתיק ומבוסס היטב וקיים גם בארמית. הוא מורה על קושי או מכשול, ואולי קשור ל"שקל", המביע גם מועקה. יש לנו ניסיון יומיומי עם תקלות במכשירים, בלוח הזמנים ולצערנו גם במערכות יחסים. לפעמים אפשר לתקן את הדברים ולפעמים לא. אנחנו גם יודעים מה זה להיתקל בדבר, להתנגש בו קלות או לפגוש אותו באורח לא מתוכנן, לטוב או לרע, שם הפעולה של "נתקל". עד כאן, הכול בסדר.
לפני שנים, מניסיוני כדובר עברית, היה נדיר מאוד להיתקל בצורה "תקול", לציון מצבם של מכשיר או מערכת שאמורים לפעול אך תקלה מונעת זאת מהם. המונח החל לבצבץ פה ושם, בעיקר בנוגע למכשירים, ויתכן שהפעם הראשונה ששמעתי אותו הייתה בצבא, כשדובר על מכשיר קשר שאינו במצב שמיש, אלא מונח בצד, עם תקלה, ודורש תיקון. "תקול" כנראה אכן מתייחד, בשימוש, לפריט המוגדר שאפשר להצביע עליו ולציין את מצבו, את היותו מקולקל. השימוש בצורה התרחב והיא היום נפוצה. המעבר הזה, מנדירות לתפוצה רחבה, אינו חלק מהמידע שהמילונים מספקים לנו. האפשרות שהייתה קיימת, מורפולוגית וככל הנראה גם לפי טקסטים, לקיומה של הצורה "תקול", התממשה מעצם השימוש, מההופעה בטקסטים כתובים ומדוברים במשך השנים האחרונות.
הדבר מעלה את השאלה בדבר משמעות קיומם של דברים בשפה. האם האפשרות לגזור צורה אומרת שהיא קיימת? ואם צורה גזורה או נטויה – על פי מנגנונים עבריים רגילים ומקובלים - אינה מצויה בשום טקסט, האם היא אינה קיימת? המבחן הבסיסי לכך הוא מעשי: אם צורה אפשרית כזאת מופיעה, משמשת ומובנת על ידי השומעים (או הקוראים), אין שום תקלה, והקיום הפוטנציאלי היה לממשות.
כך אולי קרה ל"תקול", שעברה מפוטנציאל או מצורה נדירה, למימוש קיים ונפוץ, שהתקבל ללא תקלות על ידי דוברי העברית העכשווית, אולי בהשראת העברית הנהוגה בצבא ואולי הודות לדחיפה מכיוון אחר. יחד עם זאת, "מותר" בהחלט לא לאהוב את הצורה, ומותר לא פחות לא להשתמש בה.
"יש תקלה במכשיר", "יש לי תקלה בקו הטלפון", "המחשב שלי סובל מתקלה" – כולן צורות ביטוי מקובלות ונפוצות בקרבנו הדוברים, ואין שום בעיה בהן. לעצם העניין המעשי, בעולם הממשי, מכשירים משנים מצבם מתקינות לתקלה, וההשלכות הן בעיה שלנו. כך חשבתי, לפחות, עד שנציגת שירות – אדיבה באורח פלסטי ושמנוני כמקובל – התקשרה אלי בעקבות פנייתי בתלונה על תקלה באתר אינטרנט עם ממשק למשתמשים בו, וגילתה הבנה, מהסוג האמפתי הממוסחר:
"אני מבינה שאתה חווה תקלה".
"לא", אמרתי, עקשן ונטול נחת, לאחר המתנה בת שעה ומעבר בין "מענה קולי" אחד למשנהו. "אני לא חווה תקלה, אני חווה שירות גרוע. התקלה היא במערכת, וזאת לא בדיוק חוויה".
ממהרת לרצות את הלקוח, הנציגה הקפידה להימנע מהנוסח ה"חווייתי", לאחר סיבוב נוסף שבו נפלט מפיה שאני "חווה תקלה", והעתיקה את דבריי כפשוטם, לפיהם יש תקלה במערכת.
עקרונית, אפשר לומר שאין פה בעיה. "חוויה" מציינת הן דבר חיובי והן דבר שלילי. ואכן, כשיש תקלה במערכת שאנו תלויים בה, החוויה שלנו אינה טובה. אלא שאפשר גם לשים לב לכך ש-to experience האמריקני הועתק מני וביה לעברית השירותית. בתוך כך, יש הרחקה של האחריות: אם הבעיה היא במערכת, הרי שהאחראים עליה נמצאים במוקד הדיון. אך אם הלקוח הוא שחווה מה שהוא חווה, האחראים הצליחו לעשות צעד אחד לאחור, בעזרת הניסוח המכובס. ויש לשים לב שבמצבים כאלו לא ייאמר על המערכת, הממשק או אתר האינטרנט, שהם "תקולים", אולי כי ב"תקול" יש גוון סופי מדי, חמור מדי, כמו של מכשיר קשר חבוט באפסנאות צבאית. חוויה כה שלילית תהיה כנראה תקלה חמורה לכול המעורבים בדבר.
אני, אתה וחיות אחרות
רוג'ר סקרטוןפילוסופים ותיאולוגים במסורת הנוצרית ראו בבני האדם יצורים נבדלים מחיות אחרות, הודות...
X 5 דקות