הספרן של בבל

מה קרה כשסטודנט החליט לממש בפועל ספרייה אינסופית מתוך סיפור של בורחס?
X זמן קריאה משוער: רבע שעה

בסיפור הקצר "ספריית בבל" מתוך "גן השבילים המתפצלים" של חורחה לואיס בּוֹרְחֶס, מתוארת ספרייה בעלת ממדים עצומים, אולי אינסופיים, המורכבת מחדרים משושים המחוברים זה לזה במסדרונות קצרים. ארבעה מקירותיו של כל חדר נושאים חמישה מדפים, ועל כל מדף מונחים שלושים ושניים ספרים דומים. בכל ספר ארבע-מאות ועשרה עמודים ובכל אחד מהם ארבעים שורות בנות כשמונים תווים. הספרייה העצומה מכילה את כל הווריאציות האפשריות בנות 1,320,000 תווים שניתן לייצר משילוב עשרים וחמישה סימני דפוס (עשרים ושתיים אותיות אנגליות, פסיק, נקודה ורווח) – כלומר כ-251312000 ספרים.

מטבע הדברים, תוכנם של רוב רובם של הספרים הוא גיבוב אקראי לחלוטין של סימני דפוס. מספרם של אלה כה רב, והוא עולה על מספרם של אלה המכילים במקרה אפילו פסקה אחת בעלת משמעות, עד שלמשוטט בספרייה אין כמעט סיכוי להתקל בספר בעל פשר. ועם זאת, כיוון שהספרייה היא אוניברסלית, היא מכילה בהכרח את כל יצירות המופת של הספרות (לכל הפחות בכתיב המתאפשר מהאלף-בית של הספרייה). למעשה היא מכילה בהכרח:

"הכל: תולדות העתיד לפרטיהן, האוטוביוגרפיות של רבי-המלאכים, הקטלוג המהימן של הספרייה, מילין על גבי מילין של קטלוגים מזויפים, הוכחת זיופם של הקטלוגים הללו, הוכחת זיופו של הקטלוג האמיתי, האוונגליון הגנוסטי של בַּסִילידֶס, הפירוש לאוונגליון הזה, הפירוש לפירוש האוונגליון הזה, התיאור האמיתי של מוֹתךָ, הגרסה של כל ספר בכל הלשונות, המובאות מתוך כל ספר בכל הספרים." 1

המספר, אדם או "ספרן" שנולד בספרייה וחי בה את כל חייו, מתאר את אומללותם של האנשים החיים בספרייה, שנידונו לשוטט בה במשך כל חייהם ולחפש אחר נפלאותיה בלי למצוא דבר. הוא מזכיר אירועים מההיסטוריה של הספרייה, את הדתות שקמו ונפלו בה, שמועות על ספרים מהוללים שנמצאים בה או על אדם שקרא בספר מושלם והפך למין אל, על ניסיונות למצוא הגיון או פרשנות ברצפים אקראיים של סימני דפוס ועל חיפושם של ספרנים אחרי ספרים שאוצרים בחובם את סוד חייהם עצמם.

ספרייה אינסופית

"ספרייה אינסופית", תצלום: סיימון בריז

ספריית בבל אמיתית לא תוכל לקום, משום שגודלה רחב יותר מהיקום הנראה. אך האם היא יכולה לקום במרחב הווירטואלי?

בשנת 2015 הקים הסטודנט לספרות ג'ונתן בסיל (Jonathan Basile) את האתר "הספרייה של בבל" המציע עבור הגולשים גרסה וירטואלית של הספרייה האוניברסלית על פי סיפורו של בורחס.

בסיל הקים מערכת וירטואלית של "חדרים" משושים, שלכל אחד מהם מזהה ייחודי (מחרוזת שאורכה יכול להגיע לאלפי תווים), ובכל אחד מהם 640 ספרים. באופן וירטואלי, ניתן לגשת לכל חדר בספרייה, להוציא ספר מן המדף ולדפדף בעמודיו. על אף שבספרייה מספר אסטרונומי של חדרים, בכל פעם שניגש לאותו מראה מקום, נמצא את אותו תו.

הספרייה מציעה אוניברסליות בדרגה מעט נמוכה יותר משל הספרייה של בורחס. במקום כל הספרים בני 410 העמודים האפשריים, נמצאים בה כל העמודים בני 3200 התווים שניתן לחבר מעשרים ושש אותיות האלף-בית האנגלי, נקודה, רווח ופסיק (זוהי סטייה קטנה ומכוונת מעשרים וחמישה סימני הדפוס בספרייה שבורחס הגדיר בסיפורו). מדובר עדיין במספר עצום של אפשרויות, כ-104678 עמודים אפשריים. בנוסף, וזהו הבדל חשוב, בניגוד לספרייה של בורחס, בספרייה של בסיל ניתן לערוך חיפוש ולמצוא במהירות את מיקומה המדויק של כל מחרוזת. למעשה, כל חיפוש מחזיר כמה עשרות או מאות עמודים שבהם ניתן למצוא את המחרוזת. הגולשים, שלא כמו הספרנים הלכודים בסיפורו של בורחס, לא נידונו לנדוד בספרייה ולא למצוא לעולם אפילו משפט אחד בעל פשר, אלא למצוא בספרייה כל דבר שרק ירצו. התרגום לאנגלית של הפסקה הזאת, למשל, כבר נמצא בספרייה פה. תרגומה לשפות אחרות וגרסה שלה בעברית בתעתיק לטיני בוודאי נמצאות גם הן.

ג'ונתן בסיל, הספרייה של בבל

מדף בפרויקט הספרייה של ג'ונתן בסיל. אימג': ניצן פוזנר

המבקר בספרייה של בסיל מוזמן "לשוטט" בה באופן אקראי. ניתן להיכנס לכל לחדר על ידי הזנת המחרוזת המזהה שלו, לבחור באקראי קיר, מדף וספר ולהתחיל לקרוא. אם נכנס לחדר burningtomatopantsonasunday למשל, בקיר השלישי, במדף החמישי מלמעלה, לספר ה-14 יש שם מבטיח: sorjk,e (יש לציין ששמות הספרים חוזרים על עצמם, משום שיש הרבה יותר ספרים ממספר הווריאציות האפשריות של כמה עשרות תווים המרכיבים את שם הספר). הקוראים מוזמנים לנווט אל הספר בעצמם, אך יכולים גם ללחוץ כאן.

העמוד הראשון בספר מכיל, ככל עמוד, 3200 תווים, ואילו בספר כולו יש רק שתי מילים באנגלית שאינן לכודות בתוך רצף תווים אחר: well ו-git (קל יחסית לגלות זאת באמצעות כלי שבסיל הוסיף לאתר המדגיש מילים באנגלית). יתרה מכך, מובן שהמילים אינן מתחברות למשפט בעל משמעות. העמוד השני בספר מכיל רק מילה אחת והשלישי שוב, רק שתיים. זהו, ללא שום ספק, הכלל לגבי רוב רובם של העמודים בספרייה. אפשר אפילו לומר שכל העמודים, פרט למיעוט זניח, אינם מכילים מידע קוהרנטי.

אם נחזור למדף החמישי בקיר השלישי בחדר burningtomatopantsonasunday, ונעבור על כל העמודים בכל הספרים במדף, יש להניח שנמצא כמה מילים באנגלית, אולי משפט סתום בן שתי מילים, אם התמזל מזלנו ובחרתי באקראי חדר המכיל משפט כזה. אלא שרוב הסיכויים שבמדף כולו, למעשה בחדר כולו, אין עמוד אחד ששיש בו יותר משטויות. רוב הסיכויים, אך לא בהכרח, משום שייתכן שדווקא בחדר הזה מסתתר באחד הספרים שיר שובה לב, או הייקו מעורר מחשבה או אולי גם "התיאור האמיתי של מותכם".

מי שמגביל את עצמו לשיטוט כזה בספרייה יכול להבין בקלות את עגמומיותו של הספרן בסיפורו של בורחס, שמכלה את ימיו בדפדוף בספרים שלמים חסרי פשר. כמה ימים נחוצים כדי לדפדף בכל 262,400 העמודים בחדר? בקצב מרשים של חמש שניות לקריאת עמוד, ובהנחה שהספרן אינו נח, אינו מבזבז זמן כדי להוציא את הספרים מהמדפים ולהחזיר אותם למדפים ואינו מפסיק לרגע קט על מנת להתרגש כאשר הוא מגלה שתיים או שלוש מילים רצופות: יותר משבועיים. ובתום השבועיים, נעבור לחדר הבא, burningtomatopantsonasundaz, שגם בו מאות אלפי עמודים חסרי פשר.

ועם זאת, בעוד שהספרן של בורחס משוטט אבוד בין חדרי הספרייה, אנחנו איננו שותפים לגורל האומלל הזה. בספרייה של בסיל נוכל למצוא בקלות כל דבר שנחפש. הסונטה ה-18 של שייקספיר נמצאת בספרייה פעמים רבות (מוקפת במילים אקראיות שונות, או במיקומים שונים בעמוד וכולי), למשל כאן, בעמוד 88 של הספר rnup.biovjywwora. כל שאר הסונטות שלו נמצאות גם הן בספרייה, וגם שיריו של אדגר אלן פו, וגם מילות השיר "Yellow Submarine", וכן מילותיו שיר זהה שנכתב על צוללת ירוקה. וגם אותו השיר ממש מופיע באמצע עמוד שלם מתוך "מובי דיק".

ספריית בבל, ג'ונתן בסיל

הדף בפרויקט של ג'ונתן בסיל ובו המלים של Yellow Submarine. אימג': ניצן פוזנר

לצד אלו, נמצא בספרייה גם עמוד ובו רשימה מסודרת של זוכי מדליות הארד האמריקאים במקצועות השחייה באולימפיאדת 2020 בטוקיו (להשוואה, הנה רשימת הזוכים מהאולימפיאדת בייג'ין, תחת הכותרת הנוחה: "American Bronze Medalists In Swimming Events In The Beijing Olympics"), או עמוד ובו רצף המספרים הזוכים הלוטו בשבוע הראשון של אוקטובר 2021. העמודים האלו שם, אבל מובן שלא נוכל למצוא אותם עד אשר נדע מה לחפש. מלבד זאת, ישנם גם אינספור עמודים מתחזים, עם מספרי הלוטו שלא זכו בכל הגרלות הלוטו בהיסטוריה תחת הכותרת (ואני מתרגם כאן לעברית): "מספרי הלוטו שבהחלט זכו, בכנות, בהגרלת הלוטו הישראלית של השמונה בנובמבר, אלף תשע מאות תשעים ושמונה".

אם כן, מערכת החיפוש אינה חושפת בפנינו את סודותיה של הספרייה ומותירה אותנו מתוסכלים כמו הספרנים בעולמו של בורחס. נדמיין שחברת היי-טק ביקום של בורחס החליטה להפעיל מיזם רובוטי שמאפשר חיפוש בספרייה האוניברסלית. הספרן יכול לגשת למסוף באחד החדרים ולקבל מיד את המיקום המדויק של מחרוזת חיפוש. האם הספרייה פחות מרשימה? נדמה לי שלא. ויותר מזה, היא גם לא תהפוך לשימושית הרבה יותר. בסיל מתייחס לסוגיה זאת בחלק התיאורטי הנרחב באתר. בראיון בהתכתבות הוסיף:

"התשוקה שממנה סבלו רוב הספרנים ביקום של בורחס היא התשוקה לחשוף טקסטים שעוד לא הכירו. זה בלתי אפשרי. פונקצית החיפוש (באתר) יכולה להחזיר כל טקסט שמוזן אליה, אבל רוב המשתמשים רוצים למצוא משהו מעבר למה שהם יכולים להקליד בעצמם. למשל, בספרייה של בורחס נוצרו כתות שרצו להשמיד את הספרים שנראו להם חסרי משמעות (יעוד פגום ומשימה בלתי אפשרית) או למצוא את המפתח (אינדקס) האמיתי של הספרייה. התגובה התדירה ביותר ממבקרים באתר היא (1) האם אפשר לסמן או להסיר עמודים 'חסרי משמעות' כדי למצוא את אלו בעלי המשמעות, ו-(2) האם אפשר ליצור תוכנת מחשב שתחפש בעמודים ותמצא את אלו שאנחנו מחפשים. התגובות של המבקרים באתר דומות לאלו של הספרנים של בורחס – כיצד אנחנו יכולים למצוא מה שאיננו יודעים עדיין? נראה שהשתיים (הספרייה של בורחס והספרייה של בסיל) יוצרות את אותן תשוקות ואותן אכזבות."

הכתות שבסיל מתייחס אליהן קיוו להפטר מכל הספרים חסרי הפשר בספרייה ולהותיר בה רק את כל החיבורים השימושיים. אלא שהספרייה כה גדולה, שהמשימה בלתי אפשרית, כדבריו של בורחס בסיפור:

"...המקוננים על 'האוצרות' שנשמדו מחמת שגיונם שוכחים שתי עובדות ידועות. ראשית: כה עצומה היא הספרייה שכל צמצום שמקורו אנושי סופו שבטל בשישים. שנית: כל טופס הוא יחיד במינו ואין לו תחליף, אבל, היות שהספרייה כוללת-כל, תמיד יש הרבה מאות אלפי העתקים פגומים: יצירות שאינן נבדלות אלא באות אחת או בפסיק אחד בלבד."

אגב, במקום לכתוב לי את התשובה, בסיל יכול היה פשוט לשלוח אותי לעמוד הזה.

מבחינה טכנית, הספרייה של בסיל אינה זהה לספרייה של בורחס. אמנם בגלגול הראשון של האתר, בסיל ניסה לשמור את הספרייה על דיסק קשיח ממש, אך הוא גילה במהרה שכמו הקמתה של הספרייה המוחשית, גם ספרייה דיגיטלית מלאה היא למעשה מיזם בעל מימדים בלתי אפשריים. יצירתם של הספרים היתה איטית מדי (בסיל מעריך שיצירת כל הספרייה הייתה אורכת 101918659 שנים) ומקום האכסון נגמר לאחר כמיליון ספרים מתוך כ-101918666 הספרים האפשריים. למעשה, האתר במתכונתו הנוכחית אינו מחזיק את הספרייה על גבי דיסק קשיח אלא (אם התלהבתם עד עכשיו, היכונו לאכזבה) מייצר את העמודים על פי בקשה.

הספרייה משתמשת באלגוריתם פסבדו-אקראי, הממיר את נתוני "המיקום" של כל עמוד (כלומר החדר, הקיר, המדף, הספר והעמוד) לטקסט אקראי, אך עבור כל קלט באלגוריתם מתקבל תמיד אותו עמוד. האלגוריתם מסוגל גם לבצע את ההמרה ההפוכה ולמצוא את "המיקומים" בהם נמצאת מחרוזת טקסט מסוימת, וכך פועלת פונקצית החיפוש. בתשובה לשאלתי, בסיל הסביר: "מחולל המספרים הפסבדו-אקראי שהשתמשתי בו בנוי כך שייצר כל פלט אפשרי פעם אחת, ואז יחזור להתחלה ויעבור על כל האפשרויות באותו סדר. המספר בסיפורו הקצר של בורחס מדמיין שלספרייה אותו מבנה בדיוק. "(בספרייה הדיגיטלית) כשמגיעים לכ-105000מתחילים לראות את אותם עמודים שוב." כלומר, העמוד מספר (104678+1) זהה בתוכנו לעמוד הראשון, העמוד מספר (104678+2) זהה בתוכנו לעמוד השני וכן הלאה. ועם זאת, בשלב הזה הספרייה כבר הכילה את כל העמודים האפשריים פעם אחת בדיוק.

מגבלותיה של הספרייה של בסיל, למעשה, המגבלות הטכנולוגיות או אולי הפיזיקליות שלה, משמרות את מרחקה מספריית בבל בסיפורו של בורחס. 104678 עמודים ייחודיים הם רבים במספר סדרי גודל מ-1080 האטומים ביקום, אך רחוקים מרחק רב מ-101918666 הספרים הנחוצים להשלמת הספרייה המלאה. ועם זאת, כל חיבור אפשרי בן 3200 תווים (אותיות אנגליות קטנות, פסיק, רווח ונקודה) או פחות כבר נמצא, או יכול להימצא בה. ומלבד זאת, לבסיל יש סיבה להסתפק במה שיצר: "לא הייתי רוצה, בשום אופן, להשלים את ההגשמה של הספרייה האוניברסלית בכל אחת מצורותיה - אני חושב שבמובנים רבים היא כבר הייתה קיימת בסיפורו של בורחס ולפני כן. אני מקווה שלא נפחית מערכה רק על מנת לתחזק השקפה בלתי מושגת של מה שאנו מדמיינים במציאות מחוץ לה. אני חושב שקיומה (מחוץ לסיפור) גורם לפיחות כזה."

על מנת לכלול את כל העמודים האפשריים, הספרייה צריכה להכיל מספר עצום של "חדרים" (מכיוון שבכל חדר רק 262,400 עמודים, מספר החדרים הנחוצים הוא 104678/262400, מספר בקנה מידה כמעט זהה למספר העמודים). מסיבה זאת, כאמור, המזהה הייחודי של החדרים יכול להיות בן אלפי תווים (המזהים מורכבים מרצף של אותיות קטנות וספרות, המומר על ידי האלגוריתם למספר בבסיס-10, לכן אינם צריכים להיות ארוכים עוד יותר). דפדפנים לא יכולים להכיל רצפים ארוכים כל כך בשורת הכתובת, ולכן לא ניתן פשוט לגשת לכל עמוד על ידי הזנת "המיקום" שלו בשורת הכתובת בדפדפן, ולא ניתן לשמור "סימנייה" לכל עמוד. בסיל מציע אפשרות לשמור את העמוד בכתובת מקוצרת, ושומר עבור המשתמשים מפתח, המצמיד את המזהה הייחודי הארוך לשם קצר לבחירתם. נפח הזיכרון שהספרייה עצמה, כלומר, האלגוריתם וממשק המשתמש של האתר, מנצלת, הוא כמגה-בייט אחד. רוב מוחלט של שטח האכסון של האתר מנוצל על ידי המפתח התופח של הגולשים.

עמודי הספרייה הדיגיטלית, אם כן, מתקיימים רק כל עוד מישהו צופה בהם. כשהצופה עוזב את העמוד, הוא חוזר להתקיים רק כפלט פוטנציאלי של פונקציה מתמטית. אפשר לומר שהספרייה מחזיקה את כל העמודים בני 3200 התווים האפשריים, באופן דומה לאופן שבו כל המספרי הטלפון נמצאים במקום כלשהו ברצף הספרות של π. כאשר משתמש "מוצא" בספרייה עמוד עם מחרוזת שחיפש, הוא בעצם גורם להיווצרות העמוד. בשביל ליצור עמוד ובו טבלת הזוכים בענפי השחייה באולימפיאדה לא צריך ספרייה אוניברסלית, אפשר להסתפק במעבד תמלילים.

אפשר היה לטעון שהספרייה מציעה רק אשליה של אוניברסליות, אך בסיל אינו רואה זאת כך: "אני חושב שהספרייה האוניברסלית, אפילו כשהייתה רק תרגיל מחשבתי פילוסופי (בורחס מוצא את שורשיה אצל האטומיסט היווני דמוקריטוס), אמורה להוביל אותנו להטיל ספק בבטחוננו במושגי הממשי והלא-ממשי, הנוכח והנעדר. עבור המשתמש, אין כל הבדל בין אופן השימוש בגרסה הנוכחית וזה של הגרסה הקודמת (שבה המידע כולו אוכסן), פרט לכך שגרסה זאת יכולה להחזיר את כל האפשרויות. אני לא חושב שאכסון על דיסק קשיח הוא המדד הטוב ביותר לקיום.(...) אנחנו לא חושבים שפיסות המידע האלה הופכות לממשיות ונעלמות כשאנחנו פותחים וסוגרים אותן. מבחינה מהותית, זוהי שיטה חסכונית באכסון ועשירה בעיבוד להשגת אותה תוצאה."

כלומר, בין אם העמודים שמורים על דיסק קשיח ובין אם הם מיוצרים על פי דרישה, המשתמש זוכה לחוויה זהה. אך אפשר להטיל ספק בכך שהספרייה החסכונית זהה לספרייה "קיימת". כאמור, משום שעמודי הספרייה נוצרים על פי דרישה, קל לטעון שפונקציית החיפוש באתר היא שמייצרת את תוצאות החיפוש ולא הספרייה. למעשה, זוהי הפעולה האלגוריתמית שנעשית במהלך החיפוש, כאשר העמוד המבוקש מומר לנתוני "מיקום" בספרייה שבו אפשר למצוא אותו. ראשית, המשתמש מייצר מחרוזת טקסט, והספרייה מצידה מציגה לו בחזרה בדיוק את אותה המחרוזת, בתוספת פלט האלגוריתם המציין "מיקום" על פי קונבנציה שאין לה משמעות מחוץ לספרייה של בסיל עצמה. מה החוכמה?

סוד הקסם של הספרייה טמון בכך שעל אף שהסיכויים לכך הם אפסיים, אותו שיר על הצוללת הירוקה עלול לצוץ בשיטוט אקראי בספרייה. משתמש יכול ללחוץ על כפתור ה-Random בעמוד הראשי שוב ושוב, עד שבאחת הפעמים פתאום ינחת בעמוד שאינו מכיל דבר פרט לשמו הפרטי. למען האמת, משום שידוע שהעמוד הזה קיים בהכרח, כל משתמש בעל סבלנות רבה מאוד (וחיי נצח ומספר תנאים נוספים) ימצא בספרייה את שמו הפרטי (וגם את שמותיהם של כל המשתמשים האחרים). ממש כמו הספרנים של בורחס, אנחנו יכולים לדון את עצמנו לגורל אומלל של תקווה נכזבת שיום אחד, במקרה לחלוטין, נמצא את מה שכל ימינו חיפשנו. מהבחינה הזאת, שתי הספריות - של בסיל ושל בורחס - יותר משהן מזמינות את המבקרים למצוא בהן איזה סוד גורלי, מזמינות אותם לתהות על משמעותם של שפה וידע.

כך בסיל: "העובדה שמשהו ניתן לדיגיטציה היא עדות לכך שניתן לפרק אותו לגורמים. את כל התמונות, הטקסטים, הצלילים או הסרטונים שאנחנו יכולים לראות במחשב ניתן ליצור באמצעות אלגוריתם כזה (באתר של בסיל יש ספריית תמונות הפועלת על פי עקרון דומה לספריית הספרים). הפילוסופים האטומיסטים נמשכו לרעיון הזה משום שהוא רמז כי המציאות ניתנת למיצוי - לדעתם, החוויה שלנו מורכבת ממספר סופי של אלמנטים בסיסיים והסידורים השונים של היסודות האלה מהווים את כל התצורות האפשריות של המציאות. השפה והמחשבות שלנו מורכבות באופן דומה, אנחנו נסמכים על צורות קיימות, צלילים, אותיות או רעיונות, על מנת לייצר מה שנראה לנו ספונטני ואוטונומי."

בסיפורו של בורחס, ה"ספרן" מציע את האפשרות שישנה משמעות גם בספרים שנראים אקראיים לחלוטין:

"לאמיתו של דבר מכילה הספרייה את כל התבניות המילוליות, את כל הצירופים שמאפשרים עשרים וחמשת סמלי הכתב, אבל אין בה ולוּ אבסורד אחד מוחלט. למותר לציין שהטוב בכרכים שבמשושים הרבים שתחת ניהולי קרוי 'רעם מסורק', ומשנהו 'עווית הגבס' ואחר 'אַקְסַקְסַקְסַס מְלֶא'. אמירות אלו, הנראות במבט ראשון חסרות שחר, ניתנות בלי ספק להצדקה קריפטוגרפית או אלגורית; ההצדקה הזו היא מילולית, וממילא כלולה כבר בספרייה. אינני מסוגל למצוא צירוף אותיות - "דהגמרלחטדי" - שהספרייה האלוהית לא חזתה מראש ושאין לו באחד מלשונותיה העלומות פשר מחריד. איש אינו יכול להגות הברה שלא תהיה מלאה עדנה ופחד; שלא תהווה את שמו רב-העוצמה של אל. לדבֵּר משמע לחטוא בטאוטולוגיות. איגרת סרק רבת-מלל זו קיימת כבר באחד משלושים הכרכים של חמשת המדפים של אחד המשושים הרבים עד אינספור - וכן גם הפרכתה."

כמו הספרן, גם בסיל פיתח חיבה למבנים הלשוניים האקראיים בספרייה. לשאלתי אם הוא מרבה לסייר בספרייה, ומה מצא, ענה:

 

"הסתכלתי בכמה וכמה עמודים אקראיים במהלך בדיקת הספרייה. צירופי האותיות שיוצרים מילים באנגלית הם תמיד הראשונים לתפוס את תשומת הלב, אבל עם הזמן פיתחתי הערכה רבה יותר לצירופים לא-שפתיים. קל יותר להעריך את כותרות הספרים (גם הן אקראיות) מאשר עמוד של טקסט, משום שהן יוצרות יחידות קצרות שאפשר לקלוט במבט חטוף. לעיתים קרובות אני מוצא שהן סימטריות ויפות, לעין או לאוזן. אני מדבר עם הוצאה לאור של ספרי אמנות על הדפסת כרך שהם מצאו בספרייה ששמו 'o,o,'. מצאתי שהדרך הטובה ביותר להעריך את העמודים האקראיים היא לתת לקורא-מסך (תוכנת text-to-speech) לבטא אותם. מבקר אחד באתר אמר לי שהוא נרדם תוך כדי האזנה להם".

 

ניצן פוזנר הוא סטודנט לתואר שני בהיסטוריה כללית באוניברסיטת תל אביב.

תצלום ראשי: "אינסוף", מתוך מיצב של כריס דנקן. תצלום: ג'רמי ברוקס

מאמר זה התפרסם באלכסון ב על־ידי ניצן פוזנר.

תגובות פייסבוק

> הוספת תגובה

8 תגובות על הספרן של בבל

    03
    ניצן

    הספריה של בורחס מחזיקה רק את כל הספרים בני 410 עמודים. הספריה של בסיל את כל העמודים בני 3200. שני אלה הם מספרים גדולים מאד, אך סופיים וידועים.

04
ניר

כוונתי היא שגם אם נוסיף עוד ועוד חדרים כרצוננו, ונמספר אותם 1, 2, 3, ... וכן הלאה עד אינסוף, ואורך כל ספר יהיה אינסופי, יהיו ספרים שלא יהיו בספריה.

05
ד.

צר לי להצביע על כשל במיזם היפה הזה, אבל למעשה התוכנית אינה פועלת לפי המתואר במאמר.
כאשר המשתמש מכניס מחרוזת לחיפוש בספריה, הפלט המתקבל אינו אחד הדפים שהמחרוזת היא חלק ממנו, בדומה לדוגמאות המובאות במאמר ועל פי הנוסחה המייצרת דף ממיקומו של הספר, אלא עמוד שמחרוזת הקלט היא-ורק-היא מופיעה בדף הפלט וכל שאר התווים הם רווח.
זאת בניגוד לדוגמאות המובאות במאמר שבהן הטקסט המוכר והמשמעותי מופיע בתוך טקסט אחר.

יש לדבר משמעות כאשר, על-פי הנאמר, אדם מבקש לקבל מידע נוסף, שאותו לא הכניס במחרוזת הקלט וכהמשכה הישיר. הוא לא יקבל אפילו ניסיון כושל לכך.

שיפור נוסף שאפשר להכניס בתוכנית הוא בכיוון מציאת משמעויות, למשל על ידי השוואת המחרוזות לא רק למילון האנגלי ומציאת מקבילות, אלא לאינטרנט כולו כך שיודגשו כל המחרוזות שיש להן ולו מקבילה אחת בדף כל שהוא בשפה כל שהיא, ויינתן לינק לשאילתת גוגל על המחרוזת הזו כל שבידי הקורא תהיה אפשרות למצוא משמעויות אנושיות בטקסט הרנדומלי.

רעיון מתקדם יותר יצריך תוכנה סמנטית שתקשור את כל המשמעויות שנמצאו יחד ותתרגם אותן לשפתו של השואל.

    06
    ג

    חיפוש באתר מחזיר תוצאות מכל הסוגים. גם כאלה שמופיעות בעמודים "ריקים", גם כאלה המופיעות בעמודים מלאים וגם כאלה המופיעות בעמודים המלאים רק במילים באנגלית.