בכל פעם שאתם משפרים את התרגום של Google, החברה המסחרית מרוויחה, והחברה האנושית מפסידה
X זמן קריאה משוער: 2 דקות
לאחרונה, בעת עבודתי על מאמר, נחשפתי לקהילת התרגום של Google Translate. בחדווה ראשונית הצטרפתי אליה, אבל מי יודע לכמה זמן יצליחו החיזוקים החיוביים בצורת עוד תג ואייקון של גביע לשכנע אותי להמשיך. כאשר התחלתי לתרגם מאנגלית לעברית, הביטויים היו קצרים וממוקדים יחסית, וחוץ ממספר הנפות דגל – הדרך של המשתמש/ת לציין כי ביטוי מסוים הינו פוגעני – פעולת התרגום התבצעה בקלות יחסית. בין כה וכה, רב המושאים לתרגום היו חלקי משפטים, נעדרי קונטקסט לחלוטין, ובמידה מסוימת "בלתי ניתנים לתרגום", מושג מעניין לכשעצמו, כך שפעולת תרגום עבורם לא תיצור דבר מה בעל משמעות בעולם – למשל, you death – כך במקור; כל הדוגמאות אמתיות.
לאחר לא יותר משלושים ביטויים הבנתי שמבחינת המגדר היה כדאי לכלול בממשק המשתמש שורת הכוונה אחת או שתיים. הביטוי why you are tired (ללא אותיות רישיות וללא סימן השאלה, כך במקור) יכול היה להיות מתורגם במספר אופנים. בחישוב מהיר: ארבע אופציות שונות שקשורות למגדר, עוד לפני שמבחינים בין 'למה' ל'מדוע' שמכפיל את האפשרויות (ועוד לא דיברנו על הדקדוק), וחשבתי כי עדיף ליצור סימן מוסכם שיקצר את דרך העבודה וגם לא יצור סתירות עתידיות בין סגנונות שונים של תרגום. ישנם זרמים שמעדיפים את ה"סלאש" (הלוכסן) המסורתי, עם או בלי המילה בשלמותה ("מתרגמות/מתרגמים" לעומת "דרוש/ה") יש זרמים שמעדיפים את המקף בין האפשרויות (ואפשר תמיד לשאול, איזה מגדר יצוין ראשון?), למשל "מתרגמים-ות" או "דרוש-ה" ויש הדוגלים בחיבור בין החלקים המופרדים, השולחים אלינו מסר של היעדר גבולות וחסמים מגדריים, כדוגמת "חושבימות" או "יודעותים". דעתי האישית אינה חשובה, שכן במה שלא אבחר, תמיד ארגיש שאפגע במישהו-י אחר, ולפעמים אפילו אני מוחקת ומשנה את הסדר, שלא ידעו שכתבתי קודם את הבנים.
פניתי למערכת האנונימית, והמאוד-לא-קהילתית כפי שהתברר לי, כדי לתת משוב המסביר את נקודת מבטי, וביקשתי מעט יותר תשומת לב לזווית המגדרית, כדי למנוע מצב בו כל תרגום שניתן לפרשנות, יתורגם אוטומטית ללשון זכר, רק כי זה קצר או מהיר יותר. פעלתי מתוך תקווה לעתיד שבו גם אני אוכל ללחוץ על תרגום לשאלה "Are you retired?" ולקבל לפחות שתי אפשרויות, שיתאימו לצרכי ולתפישתי את העולם כמנסה להיות שוויוני יותר. אם לא נופיע כאפשרות לשונית במילון השימושי בעולם, איך נהיה? איך יראו אותנו? איך נשפיע על מדיניות ואיך נביא לשינוי המיוחל, אם לא באמצעות השפה? השפה שלנו, עם או בלי האקדמיה ללשון, חייבת לשקף את התמורות הללו, ובוודאי בגוף משמעותי כמו קהילת התרגום של Google Translate. אגב, אני ממתינה לתשובה, מבטיחה לעדכן אם הצלחתי להשפיע.
בכתבי על נושא כל כך קוטבי, אני מאמינה שיקומו עלי רבים-ות העובדים-ות כמתרגמים-ות ואני אתואר בתור אחת ממייצגות הגורמים לאובדן עבודתם-ן. האם בכל פעם שאנחנו משפרים את התרגום שלGoogle , עוד מתרגם/ת מאבד/ת את עבודתו/ה? מה המשמעות של "תרומת תרגומים" למערכת שנוצרה למטרות רווח? כדאי לשאול האם הרווח המידי של המשתמש/ת – תרגום חינמי ומהיר – שווה ערך לתוצאות ארוכות הטווח. האם אנחנו, בעידן האוטומציה, ה-Uber (לפי רחש הזמן, כנראה בואכה עידן ה-Post-Uber) וה-Airbnb, צריכים לתמוך בקהילה שתקצר תהליכים ועלויות אך לבטח תפגע במי שתורתם אמנותם, אמנות התרגום? והאם בעצם הפיכת האמנות הזו לתרגום-מכונה, אנחנו מפרקים אותה, הורסים אותה, ועוקרים את השורשים התרבותיים שלה? ומה הכוח של Google ושל המשתמשים – כל אחד לחוד אך בעיקר יחד – בהתקרבות המהירה אל עבר ה- End of Work של ריפקין?
ענבר לבנת היא דוקטורנטית לחקר החברה האזרחית באוניברסיטה העברית; זוכת פרס מ. ברנשטיין לתרגום שירה (2008). ספרה "קפה ועוגה" ראה אור בהוצאת הקיבוץ המאוחד – ספרית פועלים.
תגובות פייסבוק
4 תגובות על גוגל המחסל
כמתרגמת ספרים וחברה בפורום אג'נדה פורום תרגום ועריכה בפייסבוק, שחברים רבים מהמתרגמים המקצועיים והטובים בארץ, קצת הופתעתי לגלות שיש דבר כזה, קהילת גוגל טרנסלייט. בפורום המתרגמים והעורכים, תרגומים של גוגל טרנסלייט מככבים במקום ראשון בקטגוריה של בדיחות מקצועיות. מנסיוני, גוגל טוב לתרגום של מילים בודדות, ולפעמים של צמד מילים או משפט חיווי בן שלוש מילים לכל היותר. מעבר לזה, היכולות שלו נעות בין הדל למגוחך. לכן אני מתקשה לראות בו יריב שמסכן את המקצוע. אני מדגישה שמדובר בתרגום של ספרים ומאמרים, לא של הוראות הפעלה למכשירים - שגם שם עוד לא גיליתי את יתרונו המובהק על האדם המתרגם. יתכן שהוא מתאים לתרגום טקסטים טכניים לגמרי, שבהם יש צורך רק במילות יחס המקשרות בין שמות של רכיבים. גם שם, לא הייתי מוותרת על עין של עורך תרגומים שיעבור ויוודא שאין שם מעידות מביכות.
זה יגיע ויותר מהר ממה שנידמה או נרצה. במיקרה היום התפרסמה כתבה האומרת שגוגל טרנסליט מכניסה אלוגריתם חדש לשימוש שישפר מאוד את יכולת התירגום של משפטים שלמים. זה ילך וישתפר ככל שישתמשו בה יותר. ובעוד חמישים שנה? בעוד מאה שנה? ויש כבר תוכנות לכתיבת סיפורים והשמים והדמיון הם הגבול.
בדיוק היום פורסם שגוגל שיפרו את האלגוריתם ועכשיו הוא מתרגם בצורה מדויקת. אז גם אם כרגע הוא לא מספיק מקצועי, זה רק עניין של זמן עד שהוא ישתווה ואף יתעלה על תוכנות התרגום הקיימות
המכולות בנמלים הוציאו את הסבלים מהשוק. מכונות האריגה הוציאו אורגים. עם כל הסימפטיה לבעלי המקצוע שמאבדים את עבודתם, אי אפשר לעצור את הגלגל.
פריצת דרך בטיפול בהתקרחות
מיכל שליובמחקר שהתפרסם אתמול ב- Proceedings of the National Academy of Sciences, הצליחו חוקרים לגרום...
X 3 דקות
שאלה בבקבוק
בלקסיקון, כלומר באוסף הפריטים שהוא אוצר המילים שלנו בשפה, יש קבוצה מיוחדת, מוזרה, משעשעת ומסקרנת. הכוונה לאונומטופאיות. ראשית, ההגדרה: אונומטופאה היא מילה שכשאנו הוגים אותה היא נשמעת כמו מה שהיא מייצגת. הפועל "זמזום" מזכיר, כשאנו אומרים אותו, את צליל הזמזום. בדומה, "hiss" באנגלית נשמע כמו צליל של פליטת אוויר תוך חיכוך קל, כמו הקול שמשמיעים נחשים מסוימים. ואכן, אונומטופאיות קיימות בשפות רבות, בוודאי לא רק בעברית ובאנגלית, וכאן מתחיל הסיפור להסתבך.
באופן כללי, בלי להתחייב לאמירה שתקיף את כל הממצאים, דומה שאונומטופיאיות נוטות לציין צלילים. הדבר הגיוני שכן הדבר המיידי שסביר לציין באמצעות מילה שנשמעת כמו הדבר עצמו היא דבר שמעצם מהותו יש לו צליל. כך אנו רואים בעברית סדרה ארוכה של פעלים ושמות עצם: "זמזום", "המהום", "שפשוף", "טפטוף", "תקתוק", "רשרוש" ועוד, ואולי אפשר לכלול גם את "חיכוך". הנטייה לגזרת הכפולים הגיונית אף היא בעברית, שכן ההכפלה מציינת גם את החזרתיות, ובצלילים הללו יש יסוד מובהק של חזרתיות.
שפות אחרות יכולות להציג הגיון פנימי אחר, שכן האופן שבו המערכת המורפולוגית מגויסת או מנוצלת כדי ליצור אונומטופאיות בלקסיקון קשור באורח הדוק לאפשרויות שהמורפולוגיה מספקת. הדבר דומה לייצוג של קולות בעלי החיים בשפות השונות. כלבים בעברית משמיעים "הב-הב", ואילו באנגלית הם משמיעים "whoof whoof" והבדלים כאלו נמצא בקלות ביחס למילים המציינות את קולות בעלי החיים בשפות רבות. והרי אין לחשוד שמרגע שברווז עובר מלונדון לפריז, אם קורה לו דבר כזה, הוא מפסיק להשמיע קולות "quack" ומתחיל לומר "coin" (שנהגה qwã). דבר אינו מכתיב לברווז את שינוי הצליל האחרון, והמילים הללו אינן קשורות כלל לברווז אלא לאופן שבו בני האדם, אנגלים וצרפתים, מייצגים בלשונותיהם את קולות הברווז הגנרי. מי שמטה אוזנו היטב לפרות ברפת, לא ישמע "מו-מו", אבל אם הוא דובר עברית, כך הוא יכנה את הקול של הפרה באשר היא פרה. ותמיד נדרשת זהירות וטוב להתרחק מהכללות: אם "זבוב" בעברית נשמע לנו כאונומטופאה, הרי שקשה לנו להוכיח דבר כזה, ועוד פחות מכך אפשר להסתמך על המקבילות בלשונות אחרות, שברובן (לפחות לפי מיטב ידיעתי) המילים הרגילות לציון החרק המעופף כלל אינן חשודות באונומטופאה. לא תמיד הצליל הוא האלמנט המוביל בקביעת שם לחרקים שמתאפיינים ברעש שהם עושים, מה גם שבכל הקשור לסיבות להיווצרות מילים ומבנים בלשון, נדרשת זהירות עוד יותר גדולה.
לכן כדאי לשוב ליסוד הדברים בכל הקשור לאונומטופאיות. נזכור כי מדובר בייצוגים של צלילים המיוחסים לדברים (מעשים, אירועים, פעולות וכד') במציאות. הרוח, טיפות הגשם, החיכוך של דבר בדבר, אוושת העלים, הרעם, הצליל העולה ממחבת שיש בה שמן רותח ואנו מניחים בה משהו לטיגון – הצלילים הם אותם הצלילים, אקוסטית, אך הייצוג שלהם בהחלט עשוי להשתנות מלשון ללשון.
אלא שבתוך קבוצת המילים שאנו יכולים להאמין באורח סביר שהן אכן אונומטופאיות, קורה שמילה מסוימת בולטת, בעיקר כיוון שמה שהיא מציינת רחוק יחסית מעולם הצלילים. הדוגמה העברית הטובה היא המילה "בקבוק". מאז ומתמיד שמעתי שמדובר באונומטופאה, וזכורה לטוב מורה בבית הספר היסודי שכדי להסביר זאת חיקתה יפה את צליל הבעבוע שעולה מפתחו של בקבוק המתרוקן במהירות לאחר שהפכו אותו כלפי מטה. לחייה הטופחות שוב ושוב, שפתיה הפולטות קולות עתירי אוויר, שכנעו בוודאי דורות של ילדים. פה ושם היה מי ששאל אותה אם הדבר נכון גם ביחס לבקבוק ריק. השאלה, שאינה נעדרת הומור, היא שאלה בלשנית-פילוסופית טובה. איזו תכונה מיוצגת באורח בולט בשמו של דבר? האם הכלי המכונה "בקבוק" מתאפיין בעיקר בצליל שנפלט ממנו כשהנוזל יוצא ממנו במהירות? עקרונית, הייתה יכולה להיות מילה אחת לבקבוק מלא ואחרת לבקבוק ריק. אך בעברית, כידוע, לא קרה דבר כזה.
כיצד אפשר לדעת ש"בקבוק" היא אונומטופאה? התשובה הפשוטה היא שאי-אפשר לדעת. מה שכן ידוע לנו הוא שלמילה "בקבוק" יש קריירה ארוכה ומפוארת בשפות שמיות רבות, והיא עמוסה רמזים לאונומטופאיות. למשל, בערבית baqbaqa, بَقْبَقَة, מציין קול של גרגור של נוזל. ואילו בארמית קלאסית מילה דומה מאוד מציינת קנקן (האם "קנקן" העברי הוא אונומטופאה? הנה לכם חידה על חידה). השורש המרובע, גזרת הכפולים, הדמיון הצלילי הברור בתוך המשפחה השמית, אומר לנו שהדעת נותנת שאו שכל המילים הללו אונומטופאיות, או שאף-אחת מהן אינה כזאת. באורח אירוני, נזכיר כי בעברית מודרנית "לבקבק" הוא למלא בקבוק בנוזל, לא לרוקן נוזל מתוך בקבוק, כלומר לבצע תהליך שבעליל אינו יוצר את הצליל שהוא לכאורה המקור לאופי האונומטופאי המיוחס ל"בקבוק".
פריט מידע נוסף שהתגלגל אלי לאחרונה, במקרה, במאמר בכתב העת Russian Linguistic Bulletin משנת 2021, ובו המחבר, בלשן בשם א. א. קיסליוב, עוסק בשורשים מרובעים בגזרת הכפולים בארמית של נוצרים מהכנסייה האשורית, שפה חיה בת ימינו. ספציפית, הוא מתייחס לדיאלקט אורמי (Urmi), שמדובר במחוז האזרי של מערב איראן וכן בדרום מזרח אזרבייג'ן. החוקר מונה שורשים כאלו (כמו "זמזם" בעברית), וברשימה מופיע baqbuqe ולצידו פירוש הפועל באנגלית: "to gurgle", כלומר "לגרגר" (כלומר צליל שמשמיע נוזל מפכה או מגורגר בגרון או כשהוא יוצא מפתחו של בקבוק). מה אפשר לומר על כך? האם מדובר בהשפעה ערבית? האם מדובר בגלגול משלבים קודמים של השפה הארמית? האם יש קשר בין הגרגור בארמית החדשה הזאת ובין כלי הקיבול המוכר לנו והמשמש למשל ליין?
רבות השאלות, אך דומה שגם תשובות לכולן ולא יבטיחו לנו ש"בקבוק" וצורות דומות, בעברית או בשפה שמית אחרת, אכן באו לעולם בשל צליל כלשהו. לקח קטן וחוזר בדבר גבולות האפשרות שלנו לדעת – והוא עולה מן העיסוק הבלשני ומצדיק את ערכו הרבה מעבר לחקר הלשון.
מדברים מתוך הקופסה
יובל קרניאלתופעת העיתונאים המגזריים פוגעת באמון הציבור בתקשורת ובהצגת העובדות והמציאות לצורך דיון...
X 8 דקות