מאמרים אקדמיים ושפת הג׳יבריש

עשרות מאמרים אקדמיים מזוייפים פורסמו בכתבי עת אקדמיים. מה מקור התופעה?
X זמן קריאה משוער: 2 דקות

מתן שמות למאמרים או קורסים אקדמיים היא אמנות בפני עצמה; לעתים מרצים (או מי שייעץ להם בבחירת השם) הם, למרבה הצער, קופירייטרים טובים יותר משהם מרצים; פעמים אחרות זה פשוט נשמע כמו ג'יבריש. ומסתבר שלפעמים, זה אכן ג'יבריש.

כשג'רמי סטריבלינג, מקס קרון ודן אגואיו היו סטודנטים לתואר שני ב-MIT, הם פיתחו את SCIgen, תכנה לייצור אוטומטי של מאמרים במדעי המחשב. באתר הפרויקט הם כותבים, " SCIgen היא תכנה שמייצרת מאמרים רנדומאליים במדעי המחשב, כולל גרפים, מספרים וציטוטים. היא משתמשת בדקדוק חופשי-הקשר (context-free grammar) כדי ליצור את כל המרכיבים הדרושים למאמרים. המטרה שלנו היא למקסם את השעשוע, על פני הקוהרנטיות." ב-2005  הם יצרו בעזרת התכנה שלהם מאמרים כמו Rooter: A Methodology for the Typical Unification of Access Points and Redundancy, שהתקבל לכנס WMSCI 2005. אפשר לראות את השתלשלות האירועים המשעשעת באתר הפרויקט, כולל תיעוד וידאו של ההרצאה.

 SCIgen היא תכנה חינמית להורדה, ולא ברור כמה אנשים השתמשו בה עד כה. מה שכן ברור הוא שעוד אנשים הגישו מאמרי ג'יבריש – אם כדי "למקסם את השעשוע" או מסיבות השמורות עמם. סיריל לאבה (Labbé), חוקר במדעי המחשב מאוניברסיטת ז'וזף פורייה מגרנובל, השתמש בתכנה מ-MIT  כדי לזהות מאמרים כאלה שהצליחו להתפרסם בין השנים 2008 ו-2013. הפעם, בניגוד למקרה של Rooter, לא מדובר בכנסים קיקיוניים: ששה עשר מאמרים התקבלו לפרסומים של ספרינגר, ויותר ממאה פורסמו על-ידי ה-IEEE. בעוד המאמר המקורי שייצרו מפתחי SCIgen התקבל מבלי שלמעשה נקרא, חלק מהמאמרים האלה עברו לכאורה בקרת עמיתים, וכולם התפרסמו בכתבי עת בתשלום.

לאבה אומר שדי קל לזהות מאמרים כאלה, אך ככל הנראה בעולם הג'יברישי של הפרסום האקדמי דרוש לכך בכל זאת אלגוריתם מסוג אחר – זה שפיתח לאבה מחפש אוצר מילים אופייני ל- SCIgen.

לטעימה של החומר המדובר, כותרתו של אחד המאמרים הייתה "TIC - מתודולוגיה לבניית מסחר מקוון", ובתקציר שלה נכתב כי החוקרים "מרכזים את מאמציהם בשלילת הטענה שגיליונות יכולים להיות מבוססי ידע, אמפטיים וקומפקטיים". כתב העת Nature ניסה להתחקות אחר זהותם של כותבי המאמר, וגילה שלפחות אחד מהם חתום עליו ללא ידיעתו. ג'רמי סטריבלינג, אחד ממפתחי SCIgen, אומר שהיה מודע לתופעה, אך לא להיקפה."מדי פעם אנחנו מקבלים אימיילים מאזרחים הגונים שמספרים לנו על מאמריSCIgen שהתפרסמו."

מעניין שרוב הכנסים שאליהם השתרבבו המאמרים האלה התרחשו בסין, וחלק ממחבריהם הם לכאורה ממוצא סיני. האם העורכים פשוט ויתרו על הניסיון להבין? לאבה שהתנסה בזיופים בעצמו - ב-2010 הוא הצליח להוסיף 102 מאמרים מזויפים שיצר תחת השם אייק אנטקרה, והפך את המדען המומצא הנ"ל למקום ה-21 במדענים המצוטטים בעולם -  רואה בהצלחתם של המאמרים המזויפים רק עוד סימפטום ל"מלחמת הספאם המתנהלת בלבו של המדע". חוקרים נמצאים תחת לחץ לפרסם כמה שיותר, הוא אומר, וזו התוצאה.

מקורות: מו"לים מסירים יותר ממאה ועשרים מאמרים ג'יברישיים – כתבה ב-Nature SCIgen – תכנה לייצור רנדומלי של מאמרים במדעי המחשב

 

מחשבה זו התפרסמה באלכסון ב


תגובות פייסבוק

> הוספת תגובה

4 תגובות על מאמרים אקדמיים ושפת הג׳יבריש

03
Mobius Dumpling

במאמר כתוב: "מעניין שרוב הכנסים שאליהם השתרבבו המאמרים האלה התרחשו בסין, וחלק ממחבריהם הם לכאורה ממוצא סיני. האם העורכים פשוט ויתרו על הניסיון להבין?"

כנראה שלא. האקדמיה הסינית ידועה בכמות הפלגיאטים והמאמרים הקיקיוניים שחבריה מפרסמים. זה נובע מהעתקה של הקריטריונים של האקדמיה המערבית: עקרון publish or perish, אבל בלי הטמעת אתיקה אקדמית או הקמת מנגנוני ביקורת. כנ"ל האקדמיה הטורקית. אני משוכנע שמדובר בבחירה של המערכת, לא ברשלנות של העורכים

בנוגע למונח "דקדוק חופשי הקשר": כשאני למדתי באוני' ת"א קראו לזה חסר-הקשר, אבל ויקיפדיה טוענת שהתרגום הוא חופשי-הקשר. לפי ספירת תוצאות גוגל נראה שהרשת באופן כללי מעדיפה "חופשי-הקשר".

04
שם מלא

תודה מיכל. שימי לב שגם בקישור שהבאת וגם בחיפוש גוגל בסיסי מופיע גם "חסר הקשר", והוא מופיע פעמים רבות יותר מ"חופשי הקשר".
העובדה שמדעני מחשב תרגמו את המונח בנסיון ראשון בלתי-מודע לאו דווקא חייבת להשתמר, אם קיים מונח חלופי בהיר יותר.
הבחירה והשיקולים הם שלך, כמובן.