קדחת הנתונים

אנחנו מחשיבים מאוד נתונים ומדדים, מזונם של אלגוריתמים ובסיס להחלטות בכל תחומי החיים הציבוריים והמדעיים. אבל האם יש באמת נתונים חופשיים משיפוט אנושי?
X זמן קריאה משוער: רבע שעה

עובדה מוזרה ביחס לעידן שלנו, המגלה אובססיה לנתונים – ל-data – היא שלעתים קרובות איננו לגמרי בטוחים למה אנחנו מתכוונים כשאנחנו מדברים על "דאטה": חלקיקים אלמנטריים של ידע? רשומות דיגיטליות? מידע טהור? לפעמים כשאנחנו מדברים על "הדאטה", אנחנו מתכוונים לתוצאות של ניתוח או לראיות הנוגעות לשאלה מסוימת. אך במקרים אחרים אנחנו משתמשים ב"דאטה" כדי לציין פחות או יותר "ראיות אמינות", כמו כשאנחנו אומרים "צורת הרבים של אנקדוטה איננה דאטה".

חוסר התלות כביכול של הנתונים בסובייקטיביות האנושית נראית כאילו היא מאפשרת לנו להעניק לנתונים נוכחות ויכולת פעולה עצמאית: "שהנתונים ידברו בעד עצמם", שהרי "נתונים אינם משקרים"

בשימוש היומיומי, המושג "דאטה" קשור לבליל של מושגים ותפישות באשר למידע, למדע ולידע. אינספור דיווחים מביעים תדהמה נוכח נפחי הנתונים שנוצרים ומעובדים, על היעילות שבה הדבר נעשה ועל הזדמנויות חדשות שנוצרו בשל כך, וגם על שלל הדרכים שבהן החברה האנושית משתנה כתוצאה מכך. אנחנו מדברים על "נתונים גולמיים" ("raw data") ומשבחים אותם על כך שהם בלתי תלויים בשיפוט האנושי. על יסוד זאת, קבלת החלטות "מונחת נתונים" (או "מבוססת ראיות") מקודמת בהקשרים רבים. יחד עם זאת, חוסר התלות כביכול של הנתונים בסובייקטיביות האנושית נראית כאילו היא מאפשרת לנו להעניק לנתונים נוכחות ויכולת פעולה עצמאית: "שהנתונים ידברו בעד עצמם", שהרי "נתונים אינם משקרים".

מתוך התערובת התמוהה הזאת, אולי מפתיע לשמוע שהופיעה בשטח חשיבה על נתונים הגובלת בחשיבה מאגית. בספר משנת 2015, Digital Destiny: How the New Age of Data Will Transform the Way We Work, Live and Communicate, שון דוברוואק (Shawn DuBravac) מתאר אוסף של "תכונות של נתונים" ומבטא את הדברים במונחים אנתרופומורפיים. דוברוואק, לשעבר הכלכלן הראשי של Consumer Electronics Association המגדיר עצמו עתידן ו"חוזה טרנדים", טוען שנתונים  "מבקשים קיום של קבע", "רוצים להתרבות", "שואפים למידיות", "רוצים להיות מובנים" ו"שואפים לתנועה".

"נתונים הם מידיים... כשנתונים נוצרים, כשהם נצפים לראשונה, נלכדים או מועתקים, הם רוצים שייעשה בהם שימוש מידי – להפעיל כוח והשפעה... נתונים נעים ללא הרף לקראת יעילות. הם מסירים מחסומים; הם סוגרים מרחקים; הם הורסים את הרגעים שבין הזיהוי וההבנה. כיוון שנתונים רוצים שיבינו אותם, הם מתעבים חיכוך".

ההחלה הזאת של תכונות כמו-אנושיות על נתונים היא ככל הנראה מטפורית, אך היא עלולה לערפל את המחשבה שלנו. נראה שמטרתה לטשטש את המידה שבה יצור הנתונים כרוך באורח הדוק בשיפוט האנושי, ובשימוש בנתונים מתוך יוזמה וכוונה של בני-האדם. וברגע שתפקידנו האנושי כמי שמניעים את הנתונים ומעורבים בהם מעורפל, לא קשה לדמיין שלנתונים יש שכל משל עצמם. ומכאן קצרה הדרך עד לאמונה שכדי לפתור את הבעיות הגדולות שלנו, כל שעלינו לעשות הוא לאסוף נתונים ולתת למחשבים  לרוץ.

רצים, ריצה, אתלטיקה, מסלול ריצה

נתונים אובייקטיביים, אולי. תצלום: סטיבן ללהם.

שאלה של מקור

המלה "data" נגזרת מלטינית, מהפועל "לתת", ומשמעותה "הדברים שניתנו". רוב קיצ'ין (Rob Kitchin), חוקר אירי בתחום מדעי החברה ומחבר הספר "The Data Revolution" שראה אור ב-2014, טען שבמקום לראות בנתונים משהו "נתון", מתאים יותר לחשוב על דאטה כמשהו ש"נלקח". בלטינית המונח יהיה "capta". אלא כשמדובר בהתגלות אלוהית, דאטה לעולם אינם "נתונים", וגם אין לקבל דאטה מתוך אמונה ותו-לא. כיצד מגדירים, מבינים, מתעדים ואוספים דאטה – כל אלו נובעים מהחלטות אנושיות, החלטות באשר למה בדיוק אנו מודדים, מתי והיכן לעשות זאת, ובאילו אמצעים. באורח בלתי-נמנע, מה שנמדד ומתועד משפיע על המסקנות הנגזרות.

למשל, רמות האלימות במשפחה הוערכו היסטורית בהערכת חסר, כיוון שהפשעים הללו תועדו לעתים רחוקות בלבד. נתונים של סקרים עלולים להחמיץ אנשים שהם חסרי בית או נמצאים במוסדות סגורים, ואם אנשים בשולי החברה אינם מיוצגים באורח מלא בסקרי דעת קהל, התוצאות עלולות להיות מוּטות. לא פעם, קובצי נתונים מוטים כך שהם כוללים אנשים שקל יותר להגיע אליהם, או שיש סבירות גבוהה יותר שישיבו לשאלות.

במחקר המדעי, הבחירות מה למדוד וכיצד למדוד הן מהותיות ביותר. אך במקרים רבים, ובמיוחד במדעי החברה, מה שאנחנו רוצים ללכוד הוא דבר שאין לו עדיין מדד ברור. לכן חובה עלינו ליצור איזו טכניקה כדי למדוד אותו. הדבר דורש בהכרח שימת דגש על היבטים מסוימים על חשבון אחרים. בדיוק כפי שהליך החשיבה כרוך בהתמקדות, כך גם איסוף נתונים מערב הצרה של תשומת הלב. משהו תמיד נותר מחוץ למדידה, מחוץ למוקד תשומת הלב.

נניח שבסיס נתונים מכיל את ההכנסה השנתית של כל משק בית במדינה לא מפותחת, יחד עם נתונים על מגוון משתנים אחרים, כמו מיקום משקי הבית, גילם ומינם של בני הבית, עיסוקיהם וכן הלאה, כשכל הנתונים נאספו בסקר שבו סוקרים עברו מבית לבית. ניתוח הנתונים יוכל להתחיל להתבצע מיד, ללא מידע נוסף.

האופן שבו נתונים נאספים מציב גבולות למסקנות שמותר לנו להפיק מהם

אך אנו עשויים לשאול שאלות אחדות. לאילו מטרות נאספו הנתונים? למשל, האם מסים עתידים להתבסס על ההכנסה שדווחה על ידי משק הבית? האם משקי בית שנסקרו עשויים להיות מעוניינים לא לייצג נכונה את הכנסתם? האם משקי בית שחבריהם משתתפים בכלכלה "לא פורמלית", בסחר חליפין או בעבודה תמורת שכר "בשחור", יהיו מסוגלים לדווח על הכנסתם באורח מדויק? מי ביצע את הסקר מבית לבית, מה היו התמריצים שלהם, וכיצד עלולים המאפיינים שלהם, טכניקות התשאול שלהם והמצב הפוליטי במדינה להשפיע על התשובות? האם הנתונים נאספו על נייר ולאחר מכן הועברו למחשב? אם אכן כך היה, מי הזין את הנתונים למחשב ובאילו תנאים? האם הנתונים נבדקו, נוקו, סוננו או שונו בדרך אחרת לפני שהוזנו?

האופן שבו נתונים נאספים מציב גבולות למסקנות שמותר לנו להפיק מהם. אילו הייתה לנו סיבה להאמין שסביר שמשקי הבית שנסקרו לא מסרו דיווח מדויק באשר להכנסתם, כיוון שהם הבינו שמטרת הסקר קשורה למיסוי, הרי שאפשר לפקפק ברמת הדיוק של הנתונים. אם משקי בית עניים יותר נוטים יותר להשתתף בכלכלת סחר החליפין, הרי שהנתונים על אודות הכנסותיהם עלולים לשקף את מצבם הכלכלי באורח שאינו מדויק כמו נתונים על הכנסות שמתקבלים ממשקי בית במעמד הביניים.

פרבר, בתים

אילו נתונים יספקו התושבים? למי? מדוע? תצלום: Lightscape

נתונים הם תבשיל קדרה

אנחנו נוטים  לחשוב על נתונים כעל חומר הגלם של הראיות. בדיוק כפי שחומרים אחרים, כמו סוכר או שמן, עוברים ממצב גולמי למצב מעובד, כך גם נתונים עוברים סדרה של טרנספורמציות לפני שאפשר לעשות בהם שימוש. וכך, לעתים מבחינים בין נתונים "גולמיים" ("raw") ובין נתונים מעובדים, כשנתונים גולמיים נתפשים לעתים קרובות כמעין אמת בסיסית, נקודת התחלה מסוג "אלו בסך הכול הנתונים, גבירתי". למשל, לאה ייפי (Lea Yipi) ב-"Global Justice and Avant-Garde Political Agency" משנת 2012 מותחת ביקורת על התפישה הרווחת באשר לאופן שבו טיעון מתקדם במסגרת תאוריה פוליטית, על המחשבה שיש "שלב ראשון, קדם-פרשני" שבו "אנחנו עוסקים בזיהוי הנתונים הגולמיים של הפרשנות". לפי התפישה הנאיבית הזאת, הוגים יריבים בתחום התאוריה הפוליטית מתחילים כולם באותם "נתונים סוציולוגיים בסיסיים, שאין לגביהם מחלוקת, שזקוקים לבחינה ביקורתית ולפרשנות".

על אף שהמחשבה הזאת על נתונים גולמיים היא שימושית, היא גם עלולה להיות מטעה, כי כפי שראינו, אפילו איסוף הנתונים הראשוני מערב כוונות, הנחות ובחירות, שכולן ביחד הן מעין עיבוד מוקדם. נושא נוסף הקשור לכך הוא כיצד אנו מטפלים בנתונים שנראים פגומים. כלים דיגיטליים עשויים לזהות מדידות מסוימות כפגומות ולבטל אותן באורח אוטומטי (תוך שימוש במעגלים ואלגוריתמים לזיהוי שגיאות), או שהם עשויים לנסות להגיב לשגיאות מדידה על ידי שילוב בין מדידות אחדות (תוך שימוש במיצוע או בטכניקות אחרות).

כשאנשים משתמשים במושג "raw data", כלומר "נתונים גולמיים", הם לרוב מתכוונים שלמטרות שלהם, הנתונים מספקים נקודת התחלה כדי להסיק מסקנות. נניח שמכשיר המודד רמה של קול משמש כדי למדוד את עוצמת הרעש בחלק מסוים במפעל תעשייתי. ברמה הפשוטה ביותר, המכשיר רושם שינויים בלחץ האוויר אשר נגרמים על ידי גלי קול. קריאות עוקבות של לחץ משולבות עם מדידות של תדריהם של גלי הקול, צורות הגלים ומשכיהם, והתוצאה היא הערכה של עוצמת הרעש ("loudness") – מושג טכני בתחום מדידת הקול, שמתאר עוצמת קול תוך התאמתה לרגישות השמיעה המשתנה של האוזן האנושית ביחס לתדרים שונים. מדידות שנחשבות לא תקינות – כיוון שהן כוללות רעש רקע חד, כמו התנגשות או צפירה של מכונית, או כיוון שלא נרשם בהן שום קול – עשויות להיות מסומנות כלא תקינות ולהיפסל. בנוסף לכך, מכשירים המודדים קול בדרך כלל מבצעים איזשהו חישוב של ממוצע על פני פרק זמן כדי לקבל "רמת קול שקולה ורציפה" לאותו פרק זמן.

נתונים גולמיים הם גם דבר והיפוכו וגם רעיון רע: נתונים צריך לבשל בזהירות

בואו נניח שהערכים הללו מועברים למחשב, ושם אדם המפעיל את המחשב מתייחס אליהם כאל "נתונים גולמיים". בחינת רמות הקול עשויה לגלות לאותו אדם רמה מיוחדת של רעש בשעות מסוימות במשך היום. מנהל המפעל שמקבל את האבחנה הזאת, עשוי לבקש בדיקות נוספות, כדי לאסוף עוד "נתונים גולמיים". בדוגמה הזאת, אפשר לזהות לפחות שלוש רמות של מה שמכונה "נתונים גולמיים": הקריאות של מדידת הלחץ של גלי הקול, המדידות הרגעיות של הרעש, ורמות הקול הממוצעות על פני פרק זמן מסוים. בנוסף לכך, המנהל עלול לראות בסיכומים שיפיק עבורו מפעיל המחשב "נתונים גולמיים" שישמשו אותו כדי לקבל החלטות באשר לאמצעים למניעת רעש.

במלים הנכוחות של ג'פרי בואקר (Geoffrey Bowker), פרופסור לאינפורמטיקה באוניברסיטת קליפורניה באירוויין: "נתונים גולמיים הם גם דבר והיפוכו וגם רעיון רע; נתונים צריך לבשל בזהירות". "גולמי", או באנגלית "raw" (כלומר "נא"), מרמז על טבעיות, דבר מה שלא נגעו בו, בעוד ש"מבושל" (באנגלית גם "שהתערבו בו", "שטיפלו בו" – א"ה) מרמז על תוצאה של תהליכים קוגניטיביים. אלא שנתונים הם תמיד תוצאה של תהליכים קוגניטיביים, תרבותיים ומוסדיים שקובעים מה לאסוף וכיצד לאסוף. במובן הזה "נתונים גולמיים" הוא אכן מונח הכולל במהותו סתירה. בשימוש המקובל ב"נתונים גולמיים", "raw data", המונח "raw" משמעו שלא בוצע כל עיבוד לאחר איסוף הנתונים, אבל המושג מסתיר צורות שונות של עיבוד שמתרחשות בהכרח לפני איסוף הנתונים.

שעון, אנלוגי

אין מדידה מדויקת. תצלום: Mpho Mojapelo

מדידה מדעית נראית לא פעם כפסגת איסוף הנתונים הקפדני, והנתונים עצמם יורשים חלק מן היוקרה של המדע. אך מדידות מדעיות ניתנות לפרשנות רק במונחים של תאוריה שקיימת עוד קודם לכן, והתאוריה הזאת משולבת במכשור המדעי שמשמש לביצוע אותן מדידות. תולדות המדע מראים כיצד היה צריך לפתח תאוריה וגם מכשירים מתאימים לפני שגדלים כמו כוח, לחץ ומתח חשמלי – שיכולנו לראות אותם בקלות כנתונים "גולמיים" הניתנים ללכידה – יכלו להימדד. הפיזיקאי והפילוסוף הצרפתי פייר דיהם (Pierre Duhem) תיאר זאת באורח מוחשי בספרו "המטרה והמבנה של התאוריה הפיזיקלית", משנת 1914:

"היכנסו למעבדה; התקרבו לשולחן הזה העמוס במכשירים כה רבים: סוללה חשמלית, חוטי נחושת מלופפים במשי, כלים מלאים בכספית, סלילים, מוט ברזל קטן ועליו מראה. צופה מכניס את המקל המתכתי של מוט, שעליו יש גומי, לתוך חורים קטנים; הברזל רוטט, ובאמצעות מראה הקשורה אליו, שולח קרני אור מעל לסרגל מצלולואיד, והצופה עוקב אחר תנועות קרן האור עליו. אין ספק, לפניכם ניסוי; באמצעות הוויברציה של נקודת האור הזאת, הפיזיקאי מתבונן לפרטי פרטים בתנודות של חתיכת הברזל. תשאלו אותו מה הוא עושה. האם הוא יענה: 'אני חוקר את התנודות של חתיכת הברזל הנושאת את המראה הזאת'? לא. הוא יאמר לכם שהוא מודד את ההתנגדות החשמלית של הסליל. אם אתם חשים תדהמה, ושואלים אותו מה פשר המלים הללו, ומה הקשר ביניהן ובין התופעה שהוא צפה בה ושאתם צפיתם בה באותה עת, הוא ישיב שהשאלה שלכם תדרוש הסברים ארוכים מאוד, והוא ימליץ לכם לקחת קורס בתורת החשמל".

"נתונים גולמיים" אינם רק בלתי אפשריים במובן המעשי, בגלל שעיבוד מוקדם הוא מציאות בלתי נמנעת, אלא שהם בלתי אפשריים במובן העקרוני, שכן איסוף הנתונים עצמו הוא כבר סוג של עיבוד

הפילוסוף קאזם סאדג-זאדה (Kazem Sadegh-Zadeh) מביא דוגמה מודרנית בספרו "Handbook of Analytic Philosophy of Medicine" משנת 2011:

"הנתונים אינם נאספים ונרשמים בפשטות, כאילו הם היו דבר שקיים קודם לכן. אלא שיצירתם היא למעשה הנדסת נתונים. תחשבו, למשל, על הכמות האדירה של מתמטיקה מתקדמת, פיזיקה, טכנולוגיית חישוב שכלולות במכשיר לתיעוד נתונים כמו ספקטרומטר של תהודה מגנטית גרעינית, או במאיץ LHC..."

לכן עצם ייצור הנתונים תמיד רלוונטי לפירושם. כפי שמציינות ליסה גיטלמן (Lisa Gitelman) ווירג'יניה ג'קסון בהקדמתן לספרן בעל הכותרת הקולעת "’Raw Data’ Is an Oxymoron" (משנת 2013): "ברמה מסוימת, אפשר לומר שאיסוף וניהול נתונים מניח מראש פרשנות". "נתונים גולמיים" אינם רק בלתי אפשריים במובן המעשי, בגלל שעיבוד מוקדם הוא מציאות בלתי נמנעת, אלא שהם בלתי אפשריים במובן העקרוני, שכן איסוף הנתונים עצמו הוא כבר סוג של עיבוד.

במלים פשוטות, ההקשר של הנתונים – מדוע הם נאספים, כיצד הם נאספים, ואילו טרנספורמציות חלו בהם – רלוונטי תמיד. לכן אין נתונים חופשיים מהקשר, ונתונים אינם יכולים לשקף אובייקטיביות מושלמת מהסוג שלא פעם יש מי שנוטים לדמיין.

גלגלי שיניים, מנוע

תמיד יש עיבוד, תמיד יש מנגנון שקולט ופולט. תצלום: איזיס פראנסה.

סוף הפוליטיקה

ההיקסמות העכשווית מנתונים, שנולדה מתוך התפתחויות טכנולוגיות מדהימות, עודד גם מספר אמונות מפוקפקות. אנחנו מתפתים להניח שנתונים מוכלים בתוך עצמם ושהם בלתי תלויים בהקשר, ושאם רק יהיו לנו מספיק נתונים, הרי שנוכל להתעלם מדאגות באשר לסיבתיות וגרימה, הטיה, בחירה ואי-שלמות. מדובר בחזון מפתה: נתונים גולמיים, שלא הושחתו על ידי שום תאוריה או אידאולוגיה, יובילו אותנו אל האמת. בעיות מורכבות ייפתרו פשוט על יד כך שנציף ונמלא אותן בנתונים. לא יידרשו מומחים, פרט לאלו שצריך כדי ליצור נתונים ולהניף ברמה את הממצאים. שום תאוריות, שום ערכים ושום העדפות לא יהיו רלוונטיים. וגם לא יהיה שום צורך לבדוק ולבחון שום הנחות.

כשרואים בנתונים מצרך גנרי, המאפיין הבולט ביותר שלהם הוא הכמות שלהם. במאמר משנת 2008, כריס אנדרסון, העורך הראשי לשעבר של כתב העת Wired, מכריז על עליית "עידן הפטה-בייט" (1024 טרה-בתים), ומדבר על נתונים כאילו מדובר בגרעינים שנשפכים לתוך טחנה: "אנחנו יכולים לשפוך את המספרים לתוך מצבורי המחשבים הגדולים ביותר שהעולם ראה מימיו, ולתת לאלגוריתמים סטטיסטיים למצוא תבניות שהמדע אינו מסוגל למצוא". דרך המחשבה הזאת על נתונים פותחת את הפתח לנרטיבים גדולים מהדמיון – ולניסוחים מפתים המועילים לגיוס משקיעים ולמכירות – אך הדבר אפשרי רק בארץ ההזיות של נתונים חופשיים מהקשר.

בשנים האחרונות דומה שהביטחון עבר מתוצרי השיקול האנושי לעבר תפישה המעניקה את הכוח לנתונים הגולמיים הטהורים, הקודמים לאידאולוגיה ולתאוריה

קוראים האמונים על הז'רגון של התורה הארגונית עשויים להכיר את ראשי התיבות DIKW, שמייצגים את המלים Data, Information, Knowledge, Wisdom – נתונים, מידע, ידע, חוכמה. מקורותיו של המודל ההיררכי הזה אינם ברורים, אבל מאז שנות ה-80 הוא נוכח בכל הדיונים העוסקים בעיבוד נתונים. (גרסאות אחדות של הרעיון כוללות מושגים אחרים, כמו Understanding [הבנה]). בתחתית ההיררכיה מצויים הנתונים, שנתפשים כגולמיים או בלתי מעובדים, וככאלו שאם הם עומדים לבדם, הרי שלמעשה אין בהם כל תועלת. מידע נחשב לנתונים כשהוא משמש למתן תשובה לשאלות פשוטות וישירות, כמו "מי", "מה", "מתי", "היכן" ו"כמה". המידע מצדו מספק את חומר הגלם לידע, שבסופו של דבר משמש מושא למחשבה ולבחינה בהקשר רחב יותר, באופן שעשוי להוביל לחוכמה, שעניינה אינה רק דיוק ויעילות אלא גם ערכים.

המסגרת הזאת, על אף שהיא מעורפלת, בהחלט כוללת מידה של סבירות. אלא שבשנים האחרונות החלו לראות בנתונים פחות חומר גלם חסר תועלת מעיקרו שבני-אדם אמורים לעבד ולעדן, ויותר מקור לכוח ולתובנות בזכות עצמם. דומה שהביטחון עבר מתוצרי השיקול האנושי לעבר תפישה המעניקה את הכוח לנתונים הגולמיים הטהורים, הקודמים לאידאולוגיה ולתאוריה.

סרגלים, מטר

אין מדידה עצמאית, אין נתון "נטו". תצלום: ויליאם וורבי

ואולם, מומחים ולא-מומחים כאחד נתקלים בעולם לא רק דרך חוויות החושים אלא גם דרך מסגרות של הבנה, שמעוצבות על ידי גורמים רבים ובהם תאוריות, ערכים, נורמות ואמונה. יכול להיות אכן מפתה להניח שההקשר הזה הוא עניין שפשוט אפשר להניח בצד, אך הנחות – ובפרט כשאנו מציבים אותן באורח מפורש – אינן מתפוגגות כך סתם. הן משפיעות על כיוון החקירה, על בחירת המדידות, על האופן שבו אוספים נתונים ומבצעים בהם טרנספורמציות, וגם על המסקנות המוסקות בסופו של דבר.

שום אלגוריתם אינו יכול לקבוע איזו החלטה טובה יותר. כל מסקנה כזאת בסך הכול מעלה את השאלה: על פי ערכיו של מי ההחלטה היא "הטובה ביותר"?

באורח בלתי נמנע, הנחות מוצאות את דרכן אל הנתונים וצובעות את המסקנות הנגזרות מהם. יתרה מכך, הן משקפות את האמונות של מי שאוספים את הנתונים. כפי שהכלכלן רונלד קוז אמר, במלים שנעשו מפורסמות: "אם אתם מענים את הנתונים די הצורך, הטבע תמיד יודה". והעיתונאית לנה גרוגר (Lena Groeger), בכתבה שהיא פרסמה באתר ProPublica בשנת 2017, ושעניינו ההטיות שמעצבים חזותיים מטביעים בעבודותיהם, העירה בצדק ש"נתונים אינם מדברים בעד עצמם – הם מהדהדים את מי שאספו אותם". כדי שהחלטות יזכו להערכה ביקורתית, הערכים  וההנחות התומכים בהן חייבים להיבחן גם הם. הדבר חיוני במיוחד כשמדובר בקבלת החלטות פוליטיות. נתונים או מדיניות "מבוססת נתונים" נתפשים במידה גוברת כתרופת פלא בכל האמור בקבלת החלטות בתחום הפוליטי. לפי המצדדים בגישה הזאת, יש לנו כעת הזדמנות להחליף את אי-הסדר והערפול המאפיינים את הפוליטיקה בסדר ההגיוני שמזומן לנו תודות לנתונים. אלא שמיקוד תשומת הלב בנתונים לא פעם מערפלת ומסתירה את הערכים וההנחות המצויים בתשתית הנתונים – וכך רק גוברת החשיבות של חשיפתם והבאתם אל שולחן הבחינה הביקורתית הרצינית. כשערכים, העדפות ואינטרסים מתנגשים, לא זאת בלבד שפוליטיקה היא בלתי נמנעת, אלא שהיא חיונית.

שום אלגוריתם אינו יכול לקבוע איזו החלטה טובה יותר. כל מסקנה כזאת בסך הכול מעלה את השאלה: על פי ערכיו של מי ההחלטה היא "הטובה ביותר"?

על פי הפנטזיות הטכנוקרטיות, הפוליטיקה תהפוך ללא רלוונטית תודות להררים של נתונים שאין אפשרות לערער עליהם. אלו המסרבים לקבל את "מה שהנתונים אומרים לנו" חייבים לכן להיות או רשעים או טיפשים. לכאורה, האפשרות הרציונלית היחידה העומדת בפני אזרחים רגילים היא לקבל את דין "הנתונים" ולכן גם את ההחלטות של האליטות הטכנוקרטיות. תחת אידאולוגיה כזאת, אין לנו להיות מופתעים מכך שהאזרחים נעשים מעורבים פחות, שהם חושדים בכל דיבור על נתונים, על "דאטה", עד כדי אובדן האמון בעצם הרעיון של נתונים כדבר משמעותי.

 

ניק ברומן (Nick Barrowman) הוא סטטיסטיקאי בכיר בבית החולים לילדים במכון East Ontario Research Institute באוטווה, קנדה.

Published by Alaxon by special agreement with The New Atlantis

תורגם במיוחד לאלכסון על ידי אדם הררי

תמונה ראשית: מדידה. תצלום: צ'רלס דלוביו, unsplash.com

Photo by Charles ???????? on Unsplash

מאמר זה התפרסם באלכסון ב על־ידי ניק ברומן, The New Atlantis.

תגובות פייסבוק