לדבר בשפה שאיננו יודעים

תרגום אוטומטי משנה את האופן שבו אנו מתקשרים עם זרים
X זמן קריאה משוער: 4 דקות

תרגום אוטומטי הוא אחד התחומים הראשונים שנחקרו במדעי המחשב, והוא הפך בהדרגה לחלק בלתי נפרד מן המרחב הווירטואלי והלא וירטואלי. גוגל מציעה לנו לתרגם דפים שכתובים בשפה זרה, פייסבוק מאפשרת לנו לתרגם פוסטים, וכמובן, יצרנים סינים משתמשים בתרגום אוטומטי כדי לנסח הוראות משעשעות למוצרים שלהם. איכות התרגום השתפרה מאד עם הזמן, גם אם נושאים מהותיים רבים – כמו זיהוי שמות ופתרון רב משמעות– לא נפתרו בצורה משביעת רצון. ובינתיים מתקדמת הטכנולוגיה הלאה, אל התרגום הקולי האוטומטי. סטארטאפים כמו Vocre  ו-Jibbigo שנרכשה על-ידי פייסבוק באוגוסט האחרון שואפים לאפשר לנו לנהל שיחות רב לשוניות בזמן אמת. כמובן שגם גוגל מפתחת יכולות דומות, וחלק מהמעורבים בתחום משערים כי המטרה תושג בעוד כעשור.

הפריצה בתחום התרגום האוטומטי התרחשה בזכות המעבר לגישה הסטטיסטית. אם כלי התרגום הראשונים התבססו על חוקים לשוניים, בצוות של גוגל טרנסלייט, כלי התרגום האוטומטי של גוגל, אין בלשנים. חברי הצוות גם לא מדברים את רוב השפות שהכלי שלהם מתרגם מהן ואליהן, והם לא צריכים. הגישה הסטטיסטית אינה מעוניינת בהבנה אנושית של השפה כלל, אלא מתבססת על השוואה של קורפוסים עצומים של טקסטים בשפת הידע ובשפת המקור, פעמים רבות טקסטים ממוסדות בינלאומיים כמו האו"ם. כבר כאן ניצב האתגר הראשון במעבר לתרגום קולי: שפה מדוברת שונה מאד משפה כתובה – היא לא סטנדרטית ולעתים קטועה (מכשולים שקיימים גם בתרגום שפה מדוברת כתובה, כמו צ'אטים), ובנוסף קיימים בה מרכיבים שנעדרים מהשפה הכתובה, כמו אינטונציה ומבטא.

בינתיים אפשר להשתמש באפליקציות השונות בעיקר לתרגום משפטים פשוטים שנהגים בבירור. אבל אם אכן יצליחו המפתחים להתגבר על המכשולים הרבים מאד שעומדים בפניהם, איך ייראה העולם שלנו? מצד אחד, יש לגישה מבוססת סטטיסטיקה סיכוי טוב יותר להעביר מסרים באופן מדויק, ומצד שני, האם ההסתמכות על נפוצות גורמת לנו לאבד חלק מהתפקידים התרבותיים של תרגום?

למשל, כשאנשים מדברים עם אחרים שאינם דוברים את השפה כשפת אם, הם נוטים לדבר במשפטים פשוטים יותר. לעומת זאת, כשאנו מדברים עם אנשים שחולקים עמנו אותה שפה ואותה תרבות, השפה שלנו תהיה מדוברת יותר ותכלול יותר רפרנסים תרבותיים.  האם באמצעות כלי התרגום הקולי נאבד את המודעות לכך שאנו מדברים עם מישהו שדובר שפה אחרת ושחי בתרבות אחרת? לדוגמה, אם ישראלי וסיני ידברו בפייסבוק והישראלי יצטט רפליקה מתכנית ריאליטי מקומית, האם התרגום יכלול פרפראזה סינית באותה רוח? האם התרגום הקולי יוסיף מעין הערת שוליים קולית, "כפי שאומרים בתכנית פופולרית בישראל", או פשוט יתעלם? האם אנחנו מעוניינים שמפגש בין תרבותי ילמד אותנו על השפה והתרבות של האחר, או שכל מה שמעניין אותנו הוא יעילות מקסימלית? רובנו ככל הנראה אפילו לא נדע במה התוכנה בחרה, ונצטרך לבטוח בה שהצליחה להעביר את התוכן והרוח של הדברים שאמרנו.

בתיאורית התרגום הפוסט-קולוניאלית מושווה לעתים מעשה התרגום לקניבליזם ­- המתרגם כביכול אוכל את המקור כדי ליצור את התרגום שלו. המטאפורה הזו מנסה להסב את תשומת לבנו לעובדה שהמקור נהרס על-ידי אחר בעל עולם מושגים ומטרות שונים לגמרי. לעומת זאת, מאחורי התרגומים האוטומטיים כביכול אין סובייקט, אלא אלגוריתם; הם אובייקטיביים. אבל גם זו בחירה אידיאולוגית, וכך קורה שגוגל טרנסלייט מנציחה סטריאוטיפים גבריים ונשיים.

מצד שני, האפשרות להסתמך על תרגום קולי אוטומטי עשויה להחזיר אותנו לשפה שלנו. בעולם גלובלי אנחנו חייבים לדעת אנגלית, ולעתים שפות זרות אחרות, כדי לתקשר עם אחרים ברמה אקדמית, עסקית ומסחרית. בעקבות זאת אנו עדים לתופעה של מוסדות אקדמיים שמעבירים שיעורים מסוימים – או את כל התכנית האקדמית שלהם – באנגלית; במקומות עבודה רבים כל התכתובת מתנהלת באנגלית, כדי להקל על העברתה הלאה במידת הצורך. בתחומים מסוימים מדברים עדיין עברית, אבל רק לכאורה – מדובר למעשה ברצף של מונחים לועזיים בתחביר עברי (גם זה למחצה; ראו: אני חייבת לרסטט את הסרברים כי יותר מדי יוזרים עשו לוג אין). שימוש בתוכנות תרגום יכול להחזיר לנו את היכולת לדבר בינינו לבין עצמנו. ומה יקרה אז לשפות שייעשו מבודדות זו מזו?

ובינתיים, איך מתמודדים עם השגיאות של המתרגמים האוטומטיים? טעויות בתרגום מכונה הן עניין בלתי נמנע, אבל האמת שהן עניין בלתי נמנע גם בתרגום אנושי. אם כך, אולי לפני שנשווה את התוצאות של התרגום הקולי האוטומטי לביצועים של דובר ילידי של השפה, עלינו להשוות אותן לביצועים של מישהו שלומד אותה? אדם שלומד שפה חדשה נוטה לעשות טעויות; חלק מהטעויות האלה הן טעויות שמחשב לא יבצע לעולם, כמו שיכול אותיות או הטיה לא נכונה של פעלים. הוא יכול גם  לבחור במילה במשלב לא נכון (אני חפץ ללכת למסיבה), במילה לא מדויקת ("אני יודעת את המקום הזה" במקום "אני מכירה את המקום הזה"). השגיאות האלה יכולות לשעשע אותנו, אבל הן לא ירגיזו אותנו כמו שגיאות תרגום של מחשב.

אז איך אפשר להפוך את הטעויות של תרגום מכונה לנסבלות יותר? אולי הדרך לעשות זאת היא ללמד את המחשב להביע ספק. אדם שאינו מדבר היטב שפה כלשהי נוטה להביע את ההתלבטויות שלו (ככה אומרים?) וגם להשתמש בפידבק שהוא מקבל מבני שיחתו כדי "לעלות" על טעויות ולתקן אותן – אולי המתרגם הקולי צריך להיות רגיש גם לשינוי בנימת הקול של הנמען, ואפילו לשינויים בהבעת הפנים. זה יוכל גם להתגבר על אפקט הדומינו של תרגום שגוי, שגורם לכך שחוסר הבנה של מילה אחת יכול למוטט את המבנה התרגומי כולו. ואולי דווקא מאיתנו תבקש התוכנה הסברים - ותבקש מאיתנו לנסח מחדש את המשפט שלנו בשפה שגם מחשבים יכולים להבין.

מחשבה זו התפרסמה באלכסון ב
§ מחשבה | # אינטרנט
- דימוי שערמלצר במסעדה צרפתית בניו יורק מסביר לסועד את התפריט, 1978. צילום: גטי אימג'ס


תגובות פייסבוק

2 תגובות על לדבר בשפה שאיננו יודעים

01
קובי

היופי המלא והעשיר של שיר, למשל, יתגלה רק למי שקורא בשפת אמו. מחשבים יתקשו, לדעתי, גם בעתיד הנראה לעין, להעביר ניואנסים עדינים תלויי תרבות. ואולי טוב שכך.

02
משה אוריין

כחושבים על כך, נראה שתרגום טוב הוא למעשה כתיבה מחדש. של אותן מילים ושל אותם רעיונות. מה שעשוי ודאי להשתנות הוא המושג החמקמק הזה הנקרא "רוח". הדבק שהופך מילים ורעיונות, יפים ככל שיהיו, לכלל יצירה. תרגומים רבים, גם תרגום אנושי למרבה הצער, אינם מעבירים כהלכה את הרוח הנושבת ביצירה. קל וחומר
בתרגום ממוחשב.