מחשבות על דמוקרטיה 2: Data.Gov

(הפוסט הזה יושב חודש בקנה, סוף סוף אני מגיע אליו)

“There is a lot of data the federal government has and we need to make sure that all the data that is not private, or restricted for national security reasons, can be made public”
— Vivek Kundra, The USA’s New Chief Information Officer

"אתה לא חושב ברצינות", אמר לי שי. "אף אחד לא ישחרר את הכל, השכל של האנשים פשוט לא מסוגל לחשוב ככה". שי קרא את מסמך החזון האוטופי שלי לתשתית IT ממשלתית. הוא התחיל מרעיונות למצע טכנולוגי של מפלגת החלומות שלי בכנסת והפך מאז לטיוטא לאי-אילו עשר הצעות חוק שאני מקווה שיהפכו יום אחד להצעות אמיתיות. כותרת הפוסט הזה אגב איננה בדיחה, קצין המידע הראשי לארה"ב ויווק קונדרה אכן הכריז שתוכנות חופשיות, שיטות מיחשוב ענן ושאר כלים "מהמדף" ישמשו בסוף לפתוח במאי את המידע הממשלתי לקהל בשקיפות רדיקלית (כלומר לציבור תהיה גישה ישירה לdata sets לפי API תקני, פחות או יותר). את זאת ליוותה ההודעה הבאה לעיתונות, כחודש אחרי, מהתובע הפדראלי הכללי, בקרוב אצלנו?

"…the Department of Justice will defend a denial of a FOIA request only if (1) the agency reasonably foresees that disclosure would harm an interested protected by one of the statutory exemptions, or (2) the disclosure is prohibited by law."
New FOIA Guidelines Issued by U.S. Attorney General Eric Holder

אני חייב לספר לכם שהחיוך שלי כאב מרוב רוחב כששמעתי מה מתוכנן שם בארה"ב (אח"כ נמחק החיוך, קראו בסוף הפוסט), ולקרוא את כל הדיבורים על חשיבות היותו של המידע, הפורמט, ומערכת ההצגה שלהם פתוחות.

לפני שאדבר על מה פתוח וסגור בארץ (זה יצא בפוסט הרביעי בערך), אני חייב לצטט פה תשובה אחת למאמר בלינק האחרון, בנושא הכואב של GIS ממשלתי:

When the U.K. Govt. showed a GIS application (pre Google Earth) that could report the soil type, nearest drain, and regional rainfall for every mile of road, they could almost predict where the potholes would be and what drains were going to stop up. So smart people got together here to create the Data Interchange for Geotechnical and Geoenvironmental Specialists (URL from back in the day that Modeling Language was the moniker)

If we don't run out of money, we too may get those potholes filled faster.

–Hank

למה נושא כואב? כי בכל העולם המתוקן פורחת תעשיה ותרבות שלמה סביב מערכות GIS ממשלתיות (הציצו בפרויקט הGIS של דביאן כדי לקבל טעימה), אבל המדינה שלנו לא פתחה מעולם את מסד הנתונים של הGIS בחינם לתושבים כמו במדינות אחרות. המידע זמין מרשות המיפוי אבל תמורת בצע הרבה כסף, ואין אלטרנטיבה חופשית (יש את freemap שאיננו חופשי באמת, ויש API פתוח של גוגל-מפות אבל גם שם המידע אינו חופשי, רק הגישה אליו במקום שבתו, ושניהם רק מפות דרכים ומידע בסיסי, לא מידע GIS מלא). למה בדיוק נדרש האזרח לשלם על מידע שהופק ממילא מכספי המיסים שלו? האם לא הגיוני שהמידע הזה כבר שלו? הרי המדינה יצרה את ריכוז המידע הזה בשבילו ובכספו, והממשלה היא הרי גוף מטעם העם שמופקד על שמירת האינטרסים שלו ובמימונו. מה קורה פה לעזאזל?

מדינת ישראל שומרת על זכויות יוצרים וזכויות ההפצה של חומר ממשלתי מאוד קרוב לחזה. ועל כך הפוסט הרביעי בסדרה. בינתים, הנה קטע מתוך הצעת חוק שחשבתי להריץ:

  • דרושה רפורמה מוחלטת בחוק חופש המידע, במיוחד בהתייחס לנגישות הנתונים, ועל כן:
    • כל המידע הציבורי, יפורסם במאגר מרכז במימון המדינה (בניהולה או בידי ספקים בשוק).
    • הכנסת והממשלה חייבות להכיר כי בקצב ההתפתחות הטכנולוגית וכמות המידע אין כל דרך לצפות את כל השימושים המועילים שהציבור יפיק מהמידע הזה, ולכן יש לאפשר לתוכנות חיצוניות להפיק מידע אגרגטיבי מהמאגר מעבר למה שתוכנן בו מראש.
    • על כן המידע יוצע בתצורה שיעיל להפיק ממנה את המירב בקלות, לפחות בעזרת חיפוש טקסטואלי והקשרי באתר, ובנוסף פתיחה מלאה לאפשרויות כריית מידע והצלבת מקורות, אם מתוך המערכת המציגה אותו ואם על ידי מערכות צד ג' (ובז'ארגון: לאפשר harvest, mash-up וכולי).
    • כל מידע חסר שיבוקש פרטנית, יעודכן גם במאגר הציבורי, ואיתו שאר המידע הרלוונטי הדומה שיתברר כחסר בתהליך הגילוי.
  • שמירה על תקנים חופשיים, זמינות ונגישות. כיום אתרי הממשלה עדיין סטאטיים בחלקם, מידע חשוב אינו זמין, ותקני אינטרנט בסיסיים אינם נשמרים. החוקים קיימים אבל לא מתבצעת אכיפה.
    • תוכן שיופק במימון ציבורי – יופק עם הנגשה לפי הצורך (תיאור מילולי של תוכן קטעי וידאו עבור לקויי ראיה, כיתוביות עבור לקויי שמיעה, הפקת טקסט גם בכתב ברייל והקלטות עבור עוורים).
    • אתרי Web ומאגרי המידע הציבוריים שהוקמו בכספי ציבור ו/או של מוסדות הנהנים מתקציבים ציבוריים יעמדו בתקני W3C לתאימות לדפדפנים, ויעמדו גם בתקני הנגישות המתאימים.
    • פיתוח מנגנוני התשתית של המאגר הנ"ל ואתרי הממשלה יעשו בשקיפות, בריכוז מאמצים, ותוך מתן משקל לביקורת של אנשי מקצוע מכלל הציבור על איכות התכנון והיישום.
    • יש לדאוג שגופי ממשלה וגופים פרטיים יקבלו תמריצים כלכליים או אחרים כדי לאחד תקנים ושיטות עבודה לפי המקובלים היום ברשתות המידע הציבוריות – פורמט פתוח, קידוד יוניקוד אחיד, מטא-מידע מובנה כXML וכהנה שיטות.

    הרגשתי גיבור כשכתבתי את זה לראשונה, איך לא חשבו על זה קודם? כמובן שחיפוש קצר מצא לא מעט מאמרים קיימים בנושא והנפיחות בחזה ירדה. החיוך נמחק לגמרי כשראיתי שכל זה ועוד כבר הומלץ לממשלה בסוף 1996. אאוץ'.

    מחשבות על דמוקרטיה 1: הסימולאקרום הישראלי

    עדכון 7.4.2009: נראה שהשפה שבחרתי פה עברה את הגבול אז מיתנתי אותה קצת. לעוד פרטים קפצו לפה אם זה מעניין לכם, אבל חזרו לפה אם אתם חייבים להגיב (אתם לא, לדעתי הדיון הגיע למיצוי). במיוחד אני לא רוצה להמשיך שם את הדיון, אין לי איך לעקוב אחריו כמו שצריך.
    עדכון 12.5.2009: כינוי האיש שאת התנהלותו ביקרתי שונה כדי שהדגש יהיה על ההתנהגות ולא לגבי האיש לכשיחפשו את שם המשתמש שלו בגוגל. עם הקוראים הסליחה, אבל האיש הגדיש היום את הסאה והעביר את הויכוח לפסים אישיים, אז אני חייב לנקוט משנה זהירות ולהחזיר אותה לפסים ענייניים.
    עדכון 13.5 עוד יותר ענייני – אני מעיף את כל הכינויים המוגזמים שבהם השתמשתי כדי למנוע כל אפשרות לפירוש שגוי של כוונותי.

    במסגרת התעסקותי בפעילות למען שקיפות ונגישות ממשל יצא לי להתחכך במספר פעילי דמוקרטיה ישירה שחולקים איתי מטרות בתחום. הפגישה בינינו היא כמעט תמיד על קו התפר שבין האידאולוגיה (האוטופית לעיתים) לבין הריאליזם של היישום בשטח ברמה טכנית, טכנולוגית ואנושית. למרות שאני פועל בכיוון, אני למעשה מאמין קטן מאוד ביכולת של מישהו לחנך בזמן את עם ישראל לחשוב ולהתנהג בצורה דמוקרטית – הפחד שלי הוא שהמדינה הזו תתיבש, תחרב, תפשוט רגל, תהפך לדיקטטורה או משהו בדומה לפני שנספיק לעצור את השטפון.

    הישראלים הרי גדלו על ברכי ה"רק לא כצאן לטבח", ובנו לעצמם אתוס לאומי חילוני חדש כדי להקים פה מדינה. הציונים הראשונים מתוך התנגדות לצורת החשיבה של היהודי האנדרדוג הגלותי, אחריהם באו גלי העליה הסוציאליסטית מתוך התנגדות למשטרים ריכוזיים וחשיבה דתית צרה, אחריהם קמו התנועות הרוויזיוניסטיות, הכנענים (שהתנגדו בכלל להשאר מחוברים לעם שמפוזר בגולה), וכולי. הפצלנות והפלגנות לא הומצאו על ידי הציונות החילונית על פלגיה, הרי יהודים תמיד אהבו לשמור על בדלנות בכל קהילה שבה חיו כמעט – הלבוש השונה, הזקנים, השפה, המאון להתערב משפחתית, וסביר הרי שאלו גם קטליזטורים לפוגרומים בהיסטוריה. ומה קורה כשיוצאים מעבדות לחרות? מבקשים עגל, וניסים, ואחרי כמה שופטים דורשים גם מלך, נותנים לו את כל הכוח ביד ואז מתלוננים על חזרה לאנדרדוגיות. גם בישראל המודרנית מתוך הדמוקרטיה שלנו כבר היו לא מעט קריאות להמליך מלכים ("אריק מלך ישראל" לא היה הראשון), ואנחנו ממהרים לתת כוח ביד השלטון ולא מבקשים אותו חזרה. כידוע לכל מקיווליסט מתחיל – כוח משוחרר לא יוחזר, והוא משחית אבסולוטית. והרי על אנשים כאלו אנחנו גם מבססים את האתוס הישראלי, אחרי הכל.

    צורת החשיבה הזו מביאה למצבים שהיו מצחיקים אם הם לא היו מחליטים על חיינו. עם ישראל לא רוצה להיות אנדרדוג ובורח מאירופה. עם ישראל לא רוצה להיות מיעוט מאוים אז הוא מגרש את יושבי הארץ. עם ישראל לא רוצה להיות דיקטטורת שייחים כמקובל במזה"ת אז הוא מכריז על דמוקרטיה, אבל מסתבר שמאוד מתאים לראשי ממשלה ושריה לשמור על מושבה הכפול של הרשות המבצעת גם עם לחי שניה של עכוזה הדשן ברשות המחוקקת (ולנסות להשתלט על הרשות השופטת כדי לא להיות מוסחים על ידי ההתנגדות המציקה). והרי לנו סימולאקרום מעניין: מדינת ישראל מתנהגת כצבא כובש בקולוניה של אימפריה דמיונית (הלובי היהודי בוושינגטון?), אבל אין לה באמת אימפריה שתגבה את כמות השטויות המסוכנות שאנחנו עושים פה. מה נשתמר לנו ומה למדנו ממאבק העצמאות הזה? מעם שנאבק לא להיות יותר פראייר של אף ממשל גזעני, הפכנו למדינת אפרטהייד שיוצרת את אויביה במו ידיה, ועם שהתפרק לו האתוס הלאומי של "עם לא פראייר" נשאר רק ההד הנבוב של "רק שאני לא אצא פראייר" האישי, האגוצנטרי והמפורר, הטועה לחשוב עצמו כ"אינדיבידואליסט" כשהוא דורס את האחרים בסביבתו.

    אלו הישראלים שחותכים בתור, ברמזור, בקידום בעבודה. אלו אפילו הישראלים הנחמדים והמנומסים שלעולם לא יעשו זאת בתור בבנק אבל שולחים לי דפי עצות איך לחתוך תורים של מענה קולי במחלקות שירות לקוחות של ספק האינטרנט 1. אולי בגלל שבטלפון ובאינטרנט אף אחד לא רואה אותך או יכול לעלות עליך, אז אנשים מרשים לעצמם לתת ללשונם דרור, ולאגו שלהם להשתלט ולהשתפך. איפה דמוקרטיה ואיזו ישירה? אני מתקשה לראות איך ים של טוקבקיסטים "מטעם-" וסתם טוקבקיסטים סרי טעם יאפשרו לקולות שפויים לצוף ולהתבטא. למרות כל זאת אנחנו מחפשים דרכים לממש את האופציות.

    מאיפה כל זה עלה לי פתאום? שניים ממכרי אנשי הדמוקרטיה הישירה, הוסיפו לערך בוויקיפדיה, אחד מסדרה של ערכים הנוגעים למנגנוני ממשל מודרניים למען העם. לאחר כמה גרסאות שפורסמו ונערכו (והערך אינו סופי), ביקר בו ויקיפד, חורת אות קלון בראש המאמר ובו הוא דורש את שכתובו כי אינו משתמש בטרמינולוגיה נכונה. הויכוח שנוצר בדף השיחה של הערך מגלה שהנ"ל הוסיף את ההודעה ללא התראה, ובעודו מוחה על השימוש במילים הלא נכונות, מסרב להסכים "לגלות" מה היא הטרמינולוגיה הנכונה למרות שכל המובאות מצביעות על כך שאין למונח תרגום לשפת עֶבֶר, לא דה-פקטו ולא דה-יורה 2. למעשה עם הזמן, האיש הודה כי הוא מוחה שכותבים את הערך אנשים עם ענין אידאולוגי ולא אלטרואיזם קדוש ונקי כלשהוא.

    זו הנקודה שבה רובנו נפער עיניים משתאות. וכי מי יכתוב בויקיפדיה על נושא אם לא אנשים שמעוניינים בתחום ורוצים להביא את ההבנה בו לציבור? ומי מתנהג כך בויקיפדיה באנגלית, שיש בה עשרות אם לא מאות אלפי ערכים על שחקניות פורנו ועל כל פרק של סימפסונס, לוסט, הירוז וסיינפלד? האנציקלופדיה שמכילה יותר ערכים על שחקניות פורנו והסרטים בהם שיחקו, מאשר הויקיפדיה בשפות אחרות מכילה ערכים לגיטימיים. גם כך הויקיפדיה העברית מכילה שלל חסמים של נגישות, למה לו לאלמ|ג להתערב בעקשנות חודש ימים בערך שלא הוא יזם, שלא הוא תרם לו, ולתת בו אות קין ללא פתיחה של דיון לפני כן? הבעיה היא שמדובר בתופעה ידועה, מוכרת וחוזרת. בני קליקת הויקפדים הותיקים הזו מקפדים מאמרים ואת רצונם הטוב של התורמים ידע. במקום לתקן שתי מילים הם ישפכו 400-500 מילה כדי לחנך אחרים דרך השפלה וביקורת לא בונה. ספציפית אותו "אלמ|ג" יורד לאד-הומינם בויכוחיו, מאשים את הכותבים בחוסר ידע או הטייתו המכוונת ומכביר מילים במקום להשלים את מה שחסר בשליש מכמות ההשקעה של הויכוח (אני נדיב). כמה מהויקפדים הישראליים שכחו אולי שמדובר פה באנציקלופדיה פתוחה. עדיף שתכתוב חומר מוטה ותשאיר לאחרים לנקות ולארגן מאשר שלא תתרום ידע בכלל, ונראה ש"אלמ|ג" מעדיף שאנשים שלא עומדים בתקנים הנעלים שלו פשוט לא יכנסו לתרום זמן וידע לפרויקט. אני חושב שהוא חוטא לרעיון המרכזי של הויקיפדיה ויורה לפרויקט ברגל, כי את מעשיו והתבטאותו הוא מגבה בחוקים נעלים של ארגון כלל עולמי שמתחולל רק במוחו (שוב, הסימולאקרום אבל הפעם במיקרו) – אבל במציאות אין לו שולחים ואין חוקים שכאלו שיגבו את התנהגותו המכוערת והדורסנית.

    תוספת מאוחרת 13.5.2009: אני חוזר ומדגיש בנקודה זו למי שמפרש לא נכון: אני ממשיך להניח שכוונותיו של אלמ|ג כנות וטובות וכל רצונו הוא שמירה על איכותה של הויקיפדיה, אני קובל רק על הדרך הפוגענית וההתקפות האישיות שבהן הוא נוקט. זו אינה דרך שבה ניתן לקדם דיאלוג, ללמד, לבקר או לקבל ביקורת, ובוודאי איננה דרך לשפר את מצב הויקיפדיה ולגייס לה כותבים, ובפסקה הבאה אני מנמק:

    אלמ|ג היקר, זכור נא כי הויקיפדיה קוראת לאנשים לערוך בעזוז, ואילו אתה כויקיפד אמור לפטרל בין מאמרים חדשים, לעזור עם חיוך ובצורה תרבותית ולא לנשוך את השכנים 3, לא להניח כוונות זדון, לשמור על "ניטרליות" אבל להפנים שיש יותר מדרך אחת להבין את המונח ולעזור בדוגמא אישית במקום להקים מהומה, להתקיף אישית, להכביר בהוראות או לפתוח במלחמת עריכות.

    ולידידי כותבי המאמר, אני מחזק את ידיכם (הלוואי והיה לי מספיק ידע לעזור במאמרים כאלו בעצמי), זכרו לא להתרגש מההתקפה כי כדי להגיע למשהו טוב, מותר להפעיל את הראש ולשבור חוקים אם זה מה נדרש 4.

    הערה אחרונה לגבי תרומות לויקיפדיה מטעמים אידאולוגיים – אני לא חושב שאפשר לבוא בכלל בתלונות לאנשים שתורמים מרצונם וזמנם החופשי לפרויקט כזה, או להציב להם יותר מדי תנאים. כמה פרטי סטטיסטיקה מעניינים:
    לויקיפדיה העברית יש 90K ערכים, לשפה 5 מליון דוברים (לדעתי יותר אבל נגיד)
    לויקיפדיה באספרנטו יש 113K ערכים, שפה עם 2 מליון דוברים בלבד, אבל עם תרבות בעלת אינטרס בהפצת ידע ושיתוף ולכן סלחנות יתרה על מאמרים לא גמורים. האם צריך לפסול להם את כל הויקיפדיה?
    ומה עם שפות "אינטרסנטיות" אחרות?
    עדכון – הדוגמא גרועה, אדון בטיעונים מוצלחים יותר במקום אחר.

    אז נשים בצד את איך שמתנהגים פרטים אינטילגנטיים ונחזור להמון (הנבער יותר או פחות). נשאלת השאלה: האם עם שמצביע לכיוון מוטה ימין, שנתן יותר מ10% מקולותיו לשר חוץ שרמז (או אולי הבטיח) לשלול אזרחות של ישראלים שלא תואמים את ראית עולמו, האם העם הזה בכלל מבין מה היא דמוקרטיה, והאם הוא מסוגל לקבל על עצמו את העול של הפיכתה ליותר פתוחה? על זה בפוסטים הבאים בסדרה של שלשולי מוח. אני אשתדל לא לשעמם 🙂


    1 זה בסדר לחתוך בתור כשלא רואים אותך? ואם זה בכלל עובד, אז את מי "דפקת"? את השיטה? את הספק? לא… דפקת את הלקוחות האחרים שמעוצבנים כמוך

    2 סיבוב אחרון: לאחר התייעצות עם האקדמיה ללשון, מצדדת היום ד"ר קרן דובנוב עם כותבי הערך ולא עם הויקפד

    3 על זה לא כותבים בויקיפדיה העברית

    4 חוק שבירת חוקים זה אחד מחמשת עקרונות היסוד, עוד עמוד שמשום מה לא קיים בעברית

    ספרו החדש של קורי דוקטורוב יצא!

    ראנדומהאוס מוציאים היום למכירה את ספרו החדש של קורי דוקטורוב "אח קטן". לפי ההתלהבות של מי שהספיק לקרוא אותו, מדובר ב"חלום רטוב" של מצדדי חופש הדיבור וגיקים של תוכנה חופשית. ספר נוער סוחף המתאר איך חבורה של ילדים באמריקה עתידנית שלולת חירויות מצליחים בעזרת כישורי האקינג להחזיר את חופש הפרט והBill of rights למקומה הראוי בתשתית החברה והדמוקרטיה. נשמע כבד? חינוכי? מגמתי? אולי, אבל לפי ההתלהבויות של מי שקרא, זה גם ספר מד"ב מגניב, שיעודד אולי כמה בני נוער להתעניין יותר במדע וידע, ובנושאים של פוליטיקה ליבראלית ומתקדמת. קורי שמח שהפעם לשם שינוי הספר יוצא גם בבריטניה ולא רק בארה"ב, יש לו סיכוי להיות רב מכר מוצלח בעיני המו"ל.

    ועדיין, קורי לא מוותר על עקרונותיו. הספר עדייו ישוחרר תחת CC: לקהל תוך שבועות ספורים בחינם, וגרסת האודיובוק, לפי דרישתו, נתנת לקניה מקוונת ללא DRM וניתנת למיקס מחדש תחת CC מוגבל (מותר לקחת עד 30 דקות מהספר אם רכשת אותו כחוק ולרמקס (למקסס?) מזה מה שבא לך תחת CC-by-nc-sa, שזה לדעתי פעם ראשונה שראנדומהאוס או איזשהוא מו"ל מסכים לתנאים כאלו). יש לי הרגשה שאקנה אותו היום, למרות שממש לא חסר לי פודקאסטים להקשיב באוטו. למעשה כ"כ הרבה הצטבר לי להאזין שאולי אין ברירה אלא לקנות נגן ולהתחיל לצאת להליכות כמו שהבטחתי לרופאה שלי…

    Link to purchase and download this audiobook without Flash interaction

    עדכון: לינק להורדה של הספר