הבנת הנספר

האם סטטיסטיקה היא אמנות השקר, או שהבעיה היא בנו?
X זמן קריאה משוער: 3 דקות

מרק טוויין ייחס לבנג'מין ד'יזראלי את ההערה המפורסמת: "ישנם שלושה סוגים של שקר: שקרים, שקרים ארורים וסטטיסטיקה". בכל תעשייה, מחינוך ועד בריאות או תיירות, הפקת מידע כמותי נחשבת חיונית לשמירה על איכות בשוק תחרותי. ועם זאת, רק לעתים רחוקות הסטטיסטיקה חושפת את מה שנדמה לנו.

מהתבוננות בנתונים סטטיסטיים מעודכנים של חברות תעופה, אפשר לחשוב שיותר מטוסים מאי פעם מגיעים בזמן או מקדימים. אבל השיפור לכאורה הזה מטעה. חברות תעופה התמחו בניהול תדמיות: על ידי רישום של טיסות כאילו הן ארוכות בעשרים עד שלושים אחוזים מכפי שהן באמת, גם טיסות שעומדות בלוח הזמנים הרגיל או מאחרות במעט נחשבות עדיין כאילו הגיעו 'מוקדם' או 'בזמן'. מחקר שמומן על ידי מִנהל התעופה הפדראלי האמריקני מכנה את הטקטיקה הזו של חברות התעופה בשם schedule buffering, ויסות של לוח הזמנים.

לא ברור אם חברות תעופה המנהלות לוח זמנים מווסת משתמשות במונח 'בזמן' באותו אופן שבו אנשים מהשורה משתמשים בו. אם טיסה אמורה לארוך שעתיים וחצי, והיא אורכת בממוצע רק שעה וחצי, האם כל טיסה שמגיעה בשעה שנקבעה לה אכן הגיע בזמן? או שחברות התעופה פשוט הגדירו מחדש את המונח 'בזמן', על מנת לשפר את הסטטיסטיקה?

הדוגמה הזו – המצביעה על כך שחברות התעופה מעוותות את משמעות המושגים, וכתוצאה מכך גם את תפישת הציבור – אמנם מרגיזה, אבל זה בהחלט אינו הענף היחיד שבו ניתן למצוא מניפולציות סמנטיות של נתונים סטטיסטיים. דירוג האוניברסיטאות בולט במיוחד: אינספור כתבי עת מדרגים את האוניברסיטאות על פי מגוון אמות מידה, בהסתמך על משתנים כמו שיעור הקבלה של האוניברסיטאות, הציונים הממוצעים של התלמידים והמשרות שמוצעות להם בתום הלימודים.

אבל בשנים האחרונות התחרות בין האוניברסיטאות החריפה כל כך, עד שחלקן הודו בתמרון נכלולי של הנתונים הסטטיסטיים. באוגוסט 2012, אוניברסיטת אמורי באטלנטה הודתה, אחרי חקירה פנימית, שבמשך עשרות שנים, ההנהלה נהגה למסור דיווחים כוזבים של ציוני הסטודנטים שהתקבלו למוסד. ואֶמורי לא הייתה הפושעת היחידה: ב-2013 כתב העת "פורבס" מחק שלושה קולג'ים נחשבים מרשימת המדורגים שלו, מסיבות דומות. הנתונים הכמותיים שנבחנים על ידי כתבי העת הנוהגים לדרג את מוסדות הלימוד קובעים כיצד אנחנו, האנשים הפשוטים, מבינים משפטים כמו "האוניברסיטאות הכי טובות". אבל כיצד יכולה מערכת המתגמלת מניפולציות סמנטיות לטעון כי היא מסבירה איפה מקבלים הסטודנטים את ההשכלה הטובה ביותר?

בעיות דומות קיימות גם במערכת הבריאות בארצות הברית. מושג חשוב בדירוג בתי חולים הוא 'הישרדות', המוגדרת על ידי ה-US News & World Report כ-"30 יום לאחר האשפוז, תוך שקלול החוּמרה". אייברי קומארו (Comarow), עורכת דירוג הבריאות בעיתון אמרה, במייל, ש"תמותה כעבור שלושים יום לאחר האשפוז היא המדד המשמש חוקרים, חברות ביטוח ואת בתי החולים עצמם להערכת תמותה בבית החולים, משום שמדד כזה מכיר בכל שבתי החולים אחראים לחולים שלהם לא רק במהלך האשפוז אלא גם במשך תקופה סבירה אחרי שחרורם".

אבל מה אם קבוצת חולים שרדה רק 32 יום לאחר האשפוז? אנשים רגילים לא חושבים על "הישרדות" כעל שלושים יום אחרי כל אירוע שהוא. למה שיבטחו בשיטת דירוג שמשתמשת במונח חשוב ובסיסי בצורה שאינה מוכרת להם? ויותר מזה, האם ההגדרה הזו מפלה לטובה בתי חולים הבוחרים שלא לאשפז חולים שנדמה כי לא ישרדו עד לתאריך היעד, שלושים יום לאחר מכן? איזה לחצים המשתמעים מכך מופעלים על בתי חולים כשהחברה נסמכת על ניתוח סטטיסטי של כתבי עת מדרגים כמדריך לאיכות?

במאמר בכתב העת Statistical Science, הסוציולוג ג'ואל בֶּסט טוען כי אנחנו לא צריכים לקרוא לסטטיסטיקה 'שקר', אלא ללמד את עצמנו כך שנוכל להטיל ספק באופן שבו נתונים סטטיסטיים מונפקים, ובמטרתם. לעתים קרובות, הסטטיסטיקה נועדה לתמוך בטענות שאין בהן אמת, אבל אנחנו מעדיפים לתקוף נתונים שסותרים את מה שאנחנו עצמנו מאמינים בו. המספרים עצמם – אלא אם זויפו במתכוון – אינם יכולים לשקר, אבל ניתן להשתמש בהם כדי לעוות דיווחים לציבור ושיטות דירוג שאנחנו מתייחסים אליהם ברצינות. נתונים סטטיסטיים אינם אלה המאפשרים לשקר – לשם כך דרושות מניפולציות סמנטיות: המספרים הם המצע לשימוש הקלוקל במילים. כשמציגים בפניכם עובדה, אתם חייבים לבחון את הגדרת התנאים שעליהם היא מבוססת, ולברר כיצד נאסף המידע. כשאתם קוראים נתונים סטטיסטיים מכל סוג שהוא, הקפידו לשאול כיצד – וחשוב מזה, למה – חושבו הנתונים האלה, מי מרוויח מזה, והאם ניתן להאמין בהם.

אם הגעת עד לכאן....

...יש לנו בקשה קטנה. קוראים רבים נהנים מהתכנים האיכותיים ש'אלכסון' מציע ללא כל תמורה. הפקת כתב העת ברמה כזאת כרוכה בהשקעה רבה של עבודה וכסף: עריכה, תרגום ורכישת זכויות פרסום בחו'ל. אם הערכים והרעיונות ש'אלכסון' מקדם קרובים לליבך ואם יש בך הערכה לעבודתנו אנו מבקשים את תמיכתך כדי להבטיח את הקיימות ארוכת הטווח של כתב העת.

לתמוך באלכסון

ג'ונתן ר. גולדמן הוא חוקר במחלקה לביולוגיה בקווינס קולג' (סיטי יוניברסיטי, ניו יורק). הוא חוקר אבולוציה תרבותית. הוא עורך את האתר  Cancer Therapy Advisor.

AEON Magazine. Published on Alaxon by special permission. For more articles by AEON, follow us on Twitter.

תורגם במיוחד לאלכסון על ידי דפנה לוי

מחשבה זו התפרסמה באלכסון ב על־ידי ג'ונתן ר' גולדמן, AEON.


תגובות פייסבוק

תגובה אחת על הבנת הנספר