מחשבות על דמוקרטיה 3: חופש מידע – בידיים של מי?

בפוסט הקודם התרכזתי בארצות הברית, שם כל מסמך פדרלי מפורסם ללא זכויות יוצרים (public Domain). ספציפית ספר החוקים חופשי להעתקה על ידי כל המעונין, ולכן אין שום בעיה לבנות אתר אלטרנטיבי שמאפשר להקהל הרחב לעיין, להאיר ולהעיר על כל פסקה ולגלות מה מחוקק לו בית המחוקקים. אובמה באמת משתדל, אבל כמובן שזה לא קורה מהיום למחר, אבל האמצעים משתפרים – כמו שהצגתי בפוסט הקודם, התקנים יהיו פתוחים ומתועדים עד כמה שאפשר.

ומה בארץ? בארץ החוקים מפוזרים בקבצי PDF, DOC וסתם HTML בקידודי עברית שונים בין אתרי הממשלה השונים – חלקם באתרי המשרדים הרלוונטיים, חלקם באתר הכנסת או משרד המשפטים המקוון1, ולא רק זאת, אלא כשמתפרסם תיקון לנוסח החוק, לא יוצאת גרסא מלאה של החוק המתוקן אלא מסמך המודיע שצריך "לשנות את 'או' ל-'וגם' בסעיף 13" – קובץ diff בשפת התוכניתנים. פעם בכמה שנים יקובצו כל השינויים ויפורסם חוק ב"נוסח משולב", מה שכל מי שאי פעם קימפל לבד תוכנה בפיתוח מתמיד כמו הקרנל ויודע איזה סיוט זה לפתור התנגשויות בין patch אחד לשני, ובסוף אתה מרים ידיים והולך להשתמש בגרסא שמישהוא אחר כבר דאג לעידכונה, למשל גרסא מפוצ'פצ'ת רשמית של רד האט או דביאן ושלום על ישראל. במקרה של ספר חוקי המדינה אנחנו מדברים על חברות כמו פדאור ותקדין שמשאירות אותך עם חצי תאוותך בידך וגם זה רק אם תשלם את המחיר. (האם דמוקרטיה נגישה צריכה לעלות כסף? על זה אפילו קפיטליסט חזירי במיוחד יאלץ לענות בשלילה). תסכימו איתי בוודאי שחייב להיות גם לזה פתרון תקני וחופשי, שגם יפעל אוטומטית לפי הצורך. עדכון ידני של לשון החוק במאמרים בויקיטקסט הוא אפקטיבי לאחוזים בודדים של החוקים המעניינים, אבל לא לכמות החוקים והצעות החוק שמתרוצצות במסדרונות הממשלה.

אם הצצתם בלינק שנתתי למעלה לאופן קונגרס, תראו אתר שבאמת מספק יותר אפשרויות השתתפות ונותן חווית משתמש טובה יותר מאשר האתר הרשמי, ואכן אין ספק שגוף ממשלתי מחויב להרבה יותר בדיקות תוכנה לפני שיפרסם חומרים, ולפני שיאפשר תגובה של כל מבקר על כל סעיף. אתר חיצוני יוכל לממש את זה הרבה יותר טוב ויותר מהר, וכמובן שביתר גמישות יוכל לטפל בבעיות נגישות ומנשק משתמש, וזו היתה המטרה של קרן אור שמש כשיצרה את האתר ואת אחיו המשלימים. השאלה היא האם כל התוכן הציבורי (יענו תוכן גולשים) ששם יעיל? מסונן? האם מישהוא דואג שכל הידע שנתרם מתגבש (באגרגציה) להיות חומר נגיש למי שרוצה ליזום הצעות חוק? ואם יקומו 20 אתרים האוספים חומר ומשקיפים את השילטון, אבל אף אחד מהם אינו רשמי יותר מהאחר או יציב יותר מהאחר (מבחינת גיבוי השרתים והחומר, מימון הפרויקטים) ובוודאי שאי אפשר לסמוך על אף אחד מהם שאינו מסלף את החומר (על החומר הזה, שהוא להזכירכם public domain – קנין ציבורי, אין בית המשפט יכול להגן בזכויות יוצרים, וגם אין כאן כרגע ארגונים עם אינטרס כלכלי להיות כלבי שמירה).

אפשרות: האתרים יפתחו את כל חומר המשתמשים בXML מוסכם ויציעו את כל התכנים בצורתם הבלתי מעובדת, בדיוק כמו אתרי הממשלה.

אפשרות פחות טובה: גוגל וחברות אחרות יקחו יוזמה ויריצו את האתרים, אבל מי ישמור על השומרים?

אפשרות נוספת: האתר הראשון שיכבוש את לב האנשים (כי הוא יהיה הכי שמיש ועשיר במידע), פשוט יהפוך להיות התקן דה-פקטו, ולכן חשוב שאתר כזה יקום מהר, בקוד פתוח, בניהול קהילתי שקוף (בקיצור, ויקיפדיה-סטייל) ואז נגמרו החששות. אני מכיר אדם שעובד על כזה אתר כרגע בשביל ישראל, מישהו רוצה להצטרף לצוות שלו?

נקודת מחשבה א: האם מותר לאתר כזה לקצור מידע מאתרי הממשלה שלנו, והאם המידע שהוא ימצא שם מספק? מה מותר ואסור לעשות עם המידע הזה? (על כך הפוסט הבא)

נקודת מחשבה ב: האם פרסומי מדינה רשמיים חייבים להיות קנין ציבורי או שמא עדיף לשים אותם תחת רשיון דומה ל- CC-nd המתיר לחתוך אותם לקטעים לצורך דיונים פרטניים אך לא לסלף את תוכנם ע"י השמטה של חלקים בפרסום מלא, וכולי?

שאלה כמעט ברורה מאליה: למה בעצם אתר נפרד, למה שלא תהיה כל האינטראקטיביות הפתוחה הזו באתר הממשלתי? התשובה ברורה למדי – האינטראקטיביות פירושה כאב ראש של בטיחות מערכת, הפעלת מודרטורים, צנזור תכנים בעייתי וקצב שדרוג תוכנה שאין למערכת ממשל זמין תקציבים וכח אדם בשבילו. אתר מתנדבים פרטי יוכל לאפשר פעילויות שלא יאושרו בחיים ע"י גוף ממשלתי על שירותי מחשוב רשמיים, כמו משחקים של "מה אם", חופש ביטוי לא מוגבל, חשיפת מידע שמביך אנשי ממשל וכולי.

אני מצרף פה כמה ראיונות (חלקם ערכתי אני, במסגרת קריקטור). הם ישמשו כהקדמה לחלק הבא, והם מתייחסים לענייני שקיפות מידע, חומרים שברשות הכלל ומה ממשלתנו בדיוק עושה בנידון. מה הסכנה שבלתת את המידע לטיפולה של חברה פרטית כמו גוגל. בהמשך יופיעו בערוץ הזה עוד מציאות מגוגל שיש להן הקשר לנושא:

-------
  1. E-צדק נקודה גוב נקודה איי אל היה תפוס?[^]

מחשבות על דמוקרטיה 2: Data.Gov

(הפוסט הזה יושב חודש בקנה, סוף סוף אני מגיע אליו)

“There is a lot of data the federal government has and we need to make sure that all the data that is not private, or restricted for national security reasons, can be made public”
— Vivek Kundra, The USA’s New Chief Information Officer

"אתה לא חושב ברצינות", אמר לי שי. "אף אחד לא ישחרר את הכל, השכל של האנשים פשוט לא מסוגל לחשוב ככה". שי קרא את מסמך החזון האוטופי שלי לתשתית IT ממשלתית. הוא התחיל מרעיונות למצע טכנולוגי של מפלגת החלומות שלי בכנסת והפך מאז לטיוטא לאי-אילו עשר הצעות חוק שאני מקווה שיהפכו יום אחד להצעות אמיתיות. כותרת הפוסט הזה אגב איננה בדיחה, קצין המידע הראשי לארה"ב ויווק קונדרה אכן הכריז שתוכנות חופשיות, שיטות מיחשוב ענן ושאר כלים "מהמדף" ישמשו בסוף לפתוח במאי את המידע הממשלתי לקהל בשקיפות רדיקלית (כלומר לציבור תהיה גישה ישירה לdata sets לפי API תקני, פחות או יותר). את זאת ליוותה ההודעה הבאה לעיתונות, כחודש אחרי, מהתובע הפדראלי הכללי, בקרוב אצלנו?

"…the Department of Justice will defend a denial of a FOIA request only if (1) the agency reasonably foresees that disclosure would harm an interested protected by one of the statutory exemptions, or (2) the disclosure is prohibited by law."
New FOIA Guidelines Issued by U.S. Attorney General Eric Holder

אני חייב לספר לכם שהחיוך שלי כאב מרוב רוחב כששמעתי מה מתוכנן שם בארה"ב (אח"כ נמחק החיוך, קראו בסוף הפוסט), ולקרוא את כל הדיבורים על חשיבות היותו של המידע, הפורמט, ומערכת ההצגה שלהם פתוחות.

לפני שאדבר על מה פתוח וסגור בארץ (זה יצא בפוסט הרביעי בערך), אני חייב לצטט פה תשובה אחת למאמר בלינק האחרון, בנושא הכואב של GIS ממשלתי:

When the U.K. Govt. showed a GIS application (pre Google Earth) that could report the soil type, nearest drain, and regional rainfall for every mile of road, they could almost predict where the potholes would be and what drains were going to stop up. So smart people got together here to create the Data Interchange for Geotechnical and Geoenvironmental Specialists (URL from back in the day that Modeling Language was the moniker)

If we don't run out of money, we too may get those potholes filled faster.

–Hank

למה נושא כואב? כי בכל העולם המתוקן פורחת תעשיה ותרבות שלמה סביב מערכות GIS ממשלתיות (הציצו בפרויקט הGIS של דביאן כדי לקבל טעימה), אבל המדינה שלנו לא פתחה מעולם את מסד הנתונים של הGIS בחינם לתושבים כמו במדינות אחרות. המידע זמין מרשות המיפוי אבל תמורת בצע הרבה כסף, ואין אלטרנטיבה חופשית (יש את freemap שאיננו חופשי באמת, ויש API פתוח של גוגל-מפות אבל גם שם המידע אינו חופשי, רק הגישה אליו במקום שבתו, ושניהם רק מפות דרכים ומידע בסיסי, לא מידע GIS מלא). למה בדיוק נדרש האזרח לשלם על מידע שהופק ממילא מכספי המיסים שלו? האם לא הגיוני שהמידע הזה כבר שלו? הרי המדינה יצרה את ריכוז המידע הזה בשבילו ובכספו, והממשלה היא הרי גוף מטעם העם שמופקד על שמירת האינטרסים שלו ובמימונו. מה קורה פה לעזאזל?

מדינת ישראל שומרת על זכויות יוצרים וזכויות ההפצה של חומר ממשלתי מאוד קרוב לחזה. ועל כך הפוסט הרביעי בסדרה. בינתים, הנה קטע מתוך הצעת חוק שחשבתי להריץ:

  • דרושה רפורמה מוחלטת בחוק חופש המידע, במיוחד בהתייחס לנגישות הנתונים, ועל כן:
    • כל המידע הציבורי, יפורסם במאגר מרכז במימון המדינה (בניהולה או בידי ספקים בשוק).
    • הכנסת והממשלה חייבות להכיר כי בקצב ההתפתחות הטכנולוגית וכמות המידע אין כל דרך לצפות את כל השימושים המועילים שהציבור יפיק מהמידע הזה, ולכן יש לאפשר לתוכנות חיצוניות להפיק מידע אגרגטיבי מהמאגר מעבר למה שתוכנן בו מראש.
    • על כן המידע יוצע בתצורה שיעיל להפיק ממנה את המירב בקלות, לפחות בעזרת חיפוש טקסטואלי והקשרי באתר, ובנוסף פתיחה מלאה לאפשרויות כריית מידע והצלבת מקורות, אם מתוך המערכת המציגה אותו ואם על ידי מערכות צד ג' (ובז'ארגון: לאפשר harvest, mash-up וכולי).
    • כל מידע חסר שיבוקש פרטנית, יעודכן גם במאגר הציבורי, ואיתו שאר המידע הרלוונטי הדומה שיתברר כחסר בתהליך הגילוי.
  • שמירה על תקנים חופשיים, זמינות ונגישות. כיום אתרי הממשלה עדיין סטאטיים בחלקם, מידע חשוב אינו זמין, ותקני אינטרנט בסיסיים אינם נשמרים. החוקים קיימים אבל לא מתבצעת אכיפה.
    • תוכן שיופק במימון ציבורי – יופק עם הנגשה לפי הצורך (תיאור מילולי של תוכן קטעי וידאו עבור לקויי ראיה, כיתוביות עבור לקויי שמיעה, הפקת טקסט גם בכתב ברייל והקלטות עבור עוורים).
    • אתרי Web ומאגרי המידע הציבוריים שהוקמו בכספי ציבור ו/או של מוסדות הנהנים מתקציבים ציבוריים יעמדו בתקני W3C לתאימות לדפדפנים, ויעמדו גם בתקני הנגישות המתאימים.
    • פיתוח מנגנוני התשתית של המאגר הנ"ל ואתרי הממשלה יעשו בשקיפות, בריכוז מאמצים, ותוך מתן משקל לביקורת של אנשי מקצוע מכלל הציבור על איכות התכנון והיישום.
    • יש לדאוג שגופי ממשלה וגופים פרטיים יקבלו תמריצים כלכליים או אחרים כדי לאחד תקנים ושיטות עבודה לפי המקובלים היום ברשתות המידע הציבוריות – פורמט פתוח, קידוד יוניקוד אחיד, מטא-מידע מובנה כXML וכהנה שיטות.

    הרגשתי גיבור כשכתבתי את זה לראשונה, איך לא חשבו על זה קודם? כמובן שחיפוש קצר מצא לא מעט מאמרים קיימים בנושא והנפיחות בחזה ירדה. החיוך נמחק לגמרי כשראיתי שכל זה ועוד כבר הומלץ לממשלה בסוף 1996. אאוץ'.