מחשבות על דמוקרטיה 2: Data.Gov

(הפוסט הזה יושב חודש בקנה, סוף סוף אני מגיע אליו)

“There is a lot of data the federal government has and we need to make sure that all the data that is not private, or restricted for national security reasons, can be made public”
— Vivek Kundra, The USA’s New Chief Information Officer

"אתה לא חושב ברצינות", אמר לי שי. "אף אחד לא ישחרר את הכל, השכל של האנשים פשוט לא מסוגל לחשוב ככה". שי קרא את מסמך החזון האוטופי שלי לתשתית IT ממשלתית. הוא התחיל מרעיונות למצע טכנולוגי של מפלגת החלומות שלי בכנסת והפך מאז לטיוטא לאי-אילו עשר הצעות חוק שאני מקווה שיהפכו יום אחד להצעות אמיתיות. כותרת הפוסט הזה אגב איננה בדיחה, קצין המידע הראשי לארה"ב ויווק קונדרה אכן הכריז שתוכנות חופשיות, שיטות מיחשוב ענן ושאר כלים "מהמדף" ישמשו בסוף לפתוח במאי את המידע הממשלתי לקהל בשקיפות רדיקלית (כלומר לציבור תהיה גישה ישירה לdata sets לפי API תקני, פחות או יותר). את זאת ליוותה ההודעה הבאה לעיתונות, כחודש אחרי, מהתובע הפדראלי הכללי, בקרוב אצלנו?

"…the Department of Justice will defend a denial of a FOIA request only if (1) the agency reasonably foresees that disclosure would harm an interested protected by one of the statutory exemptions, or (2) the disclosure is prohibited by law."
New FOIA Guidelines Issued by U.S. Attorney General Eric Holder

אני חייב לספר לכם שהחיוך שלי כאב מרוב רוחב כששמעתי מה מתוכנן שם בארה"ב (אח"כ נמחק החיוך, קראו בסוף הפוסט), ולקרוא את כל הדיבורים על חשיבות היותו של המידע, הפורמט, ומערכת ההצגה שלהם פתוחות.

לפני שאדבר על מה פתוח וסגור בארץ (זה יצא בפוסט הרביעי בערך), אני חייב לצטט פה תשובה אחת למאמר בלינק האחרון, בנושא הכואב של GIS ממשלתי:

When the U.K. Govt. showed a GIS application (pre Google Earth) that could report the soil type, nearest drain, and regional rainfall for every mile of road, they could almost predict where the potholes would be and what drains were going to stop up. So smart people got together here to create the Data Interchange for Geotechnical and Geoenvironmental Specialists (URL from back in the day that Modeling Language was the moniker)

If we don't run out of money, we too may get those potholes filled faster.

–Hank

למה נושא כואב? כי בכל העולם המתוקן פורחת תעשיה ותרבות שלמה סביב מערכות GIS ממשלתיות (הציצו בפרויקט הGIS של דביאן כדי לקבל טעימה), אבל המדינה שלנו לא פתחה מעולם את מסד הנתונים של הGIS בחינם לתושבים כמו במדינות אחרות. המידע זמין מרשות המיפוי אבל תמורת בצע הרבה כסף, ואין אלטרנטיבה חופשית (יש את freemap שאיננו חופשי באמת, ויש API פתוח של גוגל-מפות אבל גם שם המידע אינו חופשי, רק הגישה אליו במקום שבתו, ושניהם רק מפות דרכים ומידע בסיסי, לא מידע GIS מלא). למה בדיוק נדרש האזרח לשלם על מידע שהופק ממילא מכספי המיסים שלו? האם לא הגיוני שהמידע הזה כבר שלו? הרי המדינה יצרה את ריכוז המידע הזה בשבילו ובכספו, והממשלה היא הרי גוף מטעם העם שמופקד על שמירת האינטרסים שלו ובמימונו. מה קורה פה לעזאזל?

מדינת ישראל שומרת על זכויות יוצרים וזכויות ההפצה של חומר ממשלתי מאוד קרוב לחזה. ועל כך הפוסט הרביעי בסדרה. בינתים, הנה קטע מתוך הצעת חוק שחשבתי להריץ:

  • דרושה רפורמה מוחלטת בחוק חופש המידע, במיוחד בהתייחס לנגישות הנתונים, ועל כן:
    • כל המידע הציבורי, יפורסם במאגר מרכז במימון המדינה (בניהולה או בידי ספקים בשוק).
    • הכנסת והממשלה חייבות להכיר כי בקצב ההתפתחות הטכנולוגית וכמות המידע אין כל דרך לצפות את כל השימושים המועילים שהציבור יפיק מהמידע הזה, ולכן יש לאפשר לתוכנות חיצוניות להפיק מידע אגרגטיבי מהמאגר מעבר למה שתוכנן בו מראש.
    • על כן המידע יוצע בתצורה שיעיל להפיק ממנה את המירב בקלות, לפחות בעזרת חיפוש טקסטואלי והקשרי באתר, ובנוסף פתיחה מלאה לאפשרויות כריית מידע והצלבת מקורות, אם מתוך המערכת המציגה אותו ואם על ידי מערכות צד ג' (ובז'ארגון: לאפשר harvest, mash-up וכולי).
    • כל מידע חסר שיבוקש פרטנית, יעודכן גם במאגר הציבורי, ואיתו שאר המידע הרלוונטי הדומה שיתברר כחסר בתהליך הגילוי.
  • שמירה על תקנים חופשיים, זמינות ונגישות. כיום אתרי הממשלה עדיין סטאטיים בחלקם, מידע חשוב אינו זמין, ותקני אינטרנט בסיסיים אינם נשמרים. החוקים קיימים אבל לא מתבצעת אכיפה.
    • תוכן שיופק במימון ציבורי – יופק עם הנגשה לפי הצורך (תיאור מילולי של תוכן קטעי וידאו עבור לקויי ראיה, כיתוביות עבור לקויי שמיעה, הפקת טקסט גם בכתב ברייל והקלטות עבור עוורים).
    • אתרי Web ומאגרי המידע הציבוריים שהוקמו בכספי ציבור ו/או של מוסדות הנהנים מתקציבים ציבוריים יעמדו בתקני W3C לתאימות לדפדפנים, ויעמדו גם בתקני הנגישות המתאימים.
    • פיתוח מנגנוני התשתית של המאגר הנ"ל ואתרי הממשלה יעשו בשקיפות, בריכוז מאמצים, ותוך מתן משקל לביקורת של אנשי מקצוע מכלל הציבור על איכות התכנון והיישום.
    • יש לדאוג שגופי ממשלה וגופים פרטיים יקבלו תמריצים כלכליים או אחרים כדי לאחד תקנים ושיטות עבודה לפי המקובלים היום ברשתות המידע הציבוריות – פורמט פתוח, קידוד יוניקוד אחיד, מטא-מידע מובנה כXML וכהנה שיטות.

    הרגשתי גיבור כשכתבתי את זה לראשונה, איך לא חשבו על זה קודם? כמובן שחיפוש קצר מצא לא מעט מאמרים קיימים בנושא והנפיחות בחזה ירדה. החיוך נמחק לגמרי כשראיתי שכל זה ועוד כבר הומלץ לממשלה בסוף 1996. אאוץ'.