גוגל מספחת את ההיסטוריה

כתבתי פה פעם שמדינת ישראל עושה שגיאה חמורה כשהיא מתקמצנת על קיטלוג ודיגוט אוצרות לאומיים, כולל ארכיון צה"ל וארכיונים לאומיים אחרים. בראיון עם דב ויינר לקריקטור העלינו את הדאגה שכדי לחסוך כסף, ישראל תתן לגוגל את הכבוד לסרוק ולשמור בעלות על סריקות שראוי שיהיו ברשות הציבור.

(חלק שני מתוך ארבעה של הראיון, ההתייחסות מתחילה בסביבות 1:40)

אשר יגורנו בא לנו. גוגל מתעתדים להשקיע את הכסף הנדרש לסריקת מגילות מים המלח (לא ברור כמה מהן), ותאפשר לקרוא אותן פלוס תרגום דרך שרתי גוגל, אבל כנראה לא להוריד את חומר הגלם לעיבוד בדרכים אחרות (בכ"ז, צריך להגן על ההשקעה). מדינת ישראל למעשה מושכת ידיה מהאחריות לסריקה והטיפול בחומר, ומשאירים ליד הנעלמה (לא כל כך) של כוחות השוק להחליט בשליטת מי יהיה המידע שאמור להנתן גולמית לחוקרים, אבל ישאר כנראה בבעלותה של גוגל.

שאלת רשיון השימוש בטקסט של ספר החוקים של ישראל

לפני כשנה כתבתי בבלוג על השאלה של רשיון השימוש בטקסט של ספר החוקים בישראל, פרוטוקולים של ישיבות ממשל וממשל מקומי, בתי משפט וכולי. מסתבר שבצורה עמומה כלשהו מתקיים על כל אחד מהם איזה רשיון שימוש מוזר. הצעות חוק הן תחת זכויות היוצרים של הכנסת (שאיננה העם, היא מורמת ממנו), פרוטוקולי בתי המשפט אינם מפורסמים באתריו, לרוב תמצאו רק ניר מלוכלך סרוק שזו גזר הדין בשני משפטים אבל תכנים מלאים של פסקי דין קשה למצוא. על ספר החוקים לא מצוינים תנאי זכויות היוצרים וגם אין חוק חקיקה במדינה (מעניין, נכון?), במקום זה יש סעיף בחוק זכויות היוצרים שאומר שהוא לא חל על חוקי המדינה. מה כן חל עליהם? חוק העזבון? חוק מקרקעי ישראל? לא ברור. אולי חוקי המדינה הם בבעלותה הפרטית מתוקף חוק אחר, ואולי הם בבחינת רשות הכלל. אין לי שמץ של מושג. אני רק יודע לחבר את הפרטים הבאים:

1. בארה"ב כל פרסום פדראלי (כולל ספר החוקים אבל לא רק), הוא ברשות הציבור. נחלת הכלל. אין צורך לתת קרדיט, אין צורך לצטט במדויק. לצערי זה אומר שגם אפשר בקלות לסלף את לשון החוק וזה אולי מוגן תחת זכות הביטוי. אין לי מושג איך הם מתגברים על זה.

2. בארץ קשה למצוא את הנוסח האחיד של החוק באתרי הממשלה, אתם תמצאו על כל חוק עוד מספר תיקונים מפוזרים, ומדי כמה שנים יוציאו "נוסח משולב" רשמי. כל תכתניתן יכול לדמין מה זה אומר לעבוד חודשים ארוכים בצוות פיתוח בלי לעשות merge לקוד המשותף – יום אחד מגלים הפתעות לא נעימות. היחידים שעושים את ה-merge הזה ידנית (ואני מקווה שבהתאם לכוונות המחוקקים והשופטים) הן חברות כמו פדאור ותקדין, אבל את המוצר שלהן אי אפשר לצרוך בצורה חופשיית.

3. לפני כשבועיים פורסם RFI למאגר חקיקה ציבורי, הכל יפהפה, קישורים דו-כיווניים בחוקים שמתייחסים האחד לשני, רעיונות מכאן ועד לירח, אבל שימו לב לסעיף המבוא המעניין שדורש שהצעות הקהל ליישום המאגר תאפשר לציבור "שימוש חופשי בנוסח החוקים, תוך שמירת זכויותיו, ככל שאפשר, של‬ הסקטור הפרטי שפיתח שירותי ערך מוסף על בסיס נוסח החקיקה".

ואני שואל את מר דן לנדאו מנכ"ל הכנסת: למה שהכנסת לא תחפש בבקשה דרך לאפשר לסקטור הפרטי להשתמש בתכנים, תוך שמירת זכויות האזרחים, ככל האפשר, לשם שינוי?

סוף סוף, התנ"ך חופשי!

לפני כמה שנים המקור היחידי לתנ"ך מנוקד ומוטעם היה את מכון ממרה אבל ברשיון מגביל שהטריד אנשים בקהילה החופשית ואני בינהם. היום נתקלתי במקרה בעובדה המרעננת שלצד פירושים כמו רש"י התנ"ך מופיע במלואו בויקיטקסט שבתורו מובא מתוך האתר הזה, שמחלק את כל התנ"ך המוקלד ללא הגבלות רשיון (ברשות הכלל) ואם תרצו להוריד ולהתקין את השרת שעליו הוא רץ עם תכניו, התוכנה כוללת חלקים GPL, חלקים CC-by-nc ואולי רשיונות אחרים, עדיין, חופשיים למדי.

כדי לצפות בטקסט האתר ממליץ על פרנק ריהל של פרויקט קולמוס הפתוח ליוניקס:
וְגַ֗ם עִירָא֙ הַיָּ֣אִרִ֔י הָיָ֥ה כֹהֵ֖ן לְדָוִֽד (שמוליק ב', כ':26)

ההמלצה למשתמשי מאק הוא פונט "רעננה" (אינני יודע מה הרשיון):
עִירָא֙ הַיִּתְרִ֔י גָּרֵ֖ב הַיִּתְרִֽי (שמוליק ב', כ"ג:38)

ואילו לחלונות אפשר לבחור בין Ezra SILרשיון פתוח תואם OSD ואפילו DFSG!):
שְׁנֵ֥י שָׁדַ֛יִךְ כִּשְׁנֵ֥י עֳפָרִ֖ים תְּאוֹמֵ֣י צְבִיָּ֑ה הָרוֹעִ֖ים בַּשּׁוֹשַׁנִּֽים (שיר השירים, ד':5)

ובין SBL Hebrew המעוצב יותר מודרני, מרנדר טעמים יותר יפה אך מופץ ברשיון חינם לשימושים בלתי מסחריים בלבד של SBL:
חֶ֚לֶץ הַפַּלְטִ֔י עִירָ֥א בֶן־עִקֵּ֖שׁ הַתְּקוֹעִֽי (שמוליק ב', כ"ג:26)

לבדיקות נוספות של רינדור, אנא פנו אל העמוד הזה.

קוריוז לגבי הציטוט האחרון – התראיינתי פעם לעבודה אצל ירושלמי בשם עירא פלטי, שנקרא על שם אותו הפסוק. המענין הוא שאביו, ד"ר פלטי, היה המיילד שיילד אותי. עירא פלטי גדול ממני בכמה שנים, אבל לאמי לא היה מושג כשבחרה לי את השם וגילתה את זה רק מאוחר יותר. מה הסיכוי?

הפוסט הזה מוקדש לשפות הנכחדות יום-יום מסביב לעולם, השבוע נפטרו דובריה האחרונים של שפת הבו באיי אנדמן.

רעיונות לשיפור חוק הגנת הפרטיות

אני מתבכיין הרבה על אובדן הפרטיות, ועל כך שאנחנו כל פעם מדלגים משריפה לשריפה, מסתימת חורים בסכר עם כל עשר האצבעות, ועוד עשר אצבעות הרגליים, ואחרי שאת החור הבא נצטרך לסתום עם הפרמשתק, אין ספק שיפתח עוד חור ועוד חור. אז כמו שאמר הרבי מקרלין: "אם הקופסא השחורה שורדת את ההתרסקות של המטוס, למה לא עושים את כל המטוס מהחומר הזה?".

לכן ישבתי וכתבתי פעם עם חברים איזה מסמך קטן כטיוטא לכמה הצעות חוק, אחת מהן מובאת כאן, הכרזנו עליה כעל פאבליק דומיין – נחלת הכלל. ההצעות שכאן נשלחו לתנועה הירוקה, למרצ, למיקי איתן, לדב חנין ואולי לעוד כמה אנשים (לא רק אני שלחתי), אבל אין לי מושג אם מישהוא לוקח מכאן רעיונות, כגי לשדרג את חוק הגנת הפרטיות ולהביאו לעידן המידע.

כתבנו את זה בדצמבר-ינואר בשנה שעברה, עכשיו זה נראה נאיבי קצת :-)

  • לא תחוקק המדינה ולא ידרוש אף ספק נתונים, כל רף כלכלי מחייב כדי שיוכל אדם לשמור על פרטיותו.
  • לא תחוקק המדינה כל חוק המפליל אזרח אך ורק על רצונו לשמור על פרטיותו.
  • לא תאגור הממשלה או כל גוף מטעמה נתונים אישיים על האזרחים ואורחות חייהם מעבר למינימום ההכרחי הדרוש לעמוד בקשר עם האזרח לצורך מילוי חובותיו האזרחיים וקבלת זכויותיו. במקרים ייחודיים כגון מפקד אוכלוסין וסקרי הלמ"ס יש לשמור על המידע בצורה מוקפדת, ולאחר שיופק כל המידע האגרגטיבי יש להשמיד את כל המידע המזהה אישית את משתתפי הסקר למעט אם הסכימו מפורשות אחרת.
  • אין לחייב בחוק כל ספק שירותי מידע (כגון מפעילים סלולאריים, טלוויזיות בכבלים וספקי אינטרנט) לאגור או לדווח מידע על תנועות ופעולות האזרח מעבר למינימום הנדרש כדי לחייבו על אותו השירות.
  • יש לאסור על ספקי רשתות הנתונים מלהכריח או לשדל כלכלית את לקוחותיהם לוותר על פרטיותם בכל מקרה, ולהמשיך להציע מסלולי שימוש שיעניקו להם את הפרטיות המירבית. (למשל האגרה שגובות בזק ומפעילות הסלולר על הפיכת מספר לחסוי).
  • כל נתון אחר שיקבלו גופי ממשלה וגופי בטחון מחברות ונותני שירותים, כגון בילוש אחרי תעבורת אינטרנט, שיחות טלפון ומיקום מכשירים סלולאריים (חוק נתוני תקשורת ודומיו), יעבור לידי אותם גופים דרך מערכת ניטור, וכל אזרח שפרטיו נחשפו לעיני שוטר או איש מנגנון ממשלה אחר יקבל על כך אוטומטית הודעה אלקטרונית או מכתב רשום תוך 30 יום, עם פירוט המידע שבורר עליו, צורך הבירור ושמות המבררים במידת האפשר. המערכת תדחה או תסתיר את חשיפת המידע אודות החיפוש אך ורק ע"י צו בית משפט, והגישה למנגנון דחית הדיווח הזה תהיה רק בסמכותו האישית של שופט, בעזרת מנגנוני אבטחת מידע, הצפנה וזיהוי כדרוש. (מוסיף שכבה להבטחת אחריותיות לחוקים כמו "מאגרי מידע" ו"נתוני תקשורת", שהיום הוא חוק מסוכן ונתון לניצול של אנשים בעמדות כוח).
  • לא תכניס הממשלה תקנות וחוקים המחייבים אזרח לעשות שימוש במערכות דיגיטליות האוספות עליו מידע אישי, בטרם תעביר לבדיקה את הנהלים והפרטים הטכניים לאישורה של ועדת בודקים בלתי תלויה של אנשי מקצוע שתכלול מומחי תוכנה, אבטחת מידע, הצפנה, משפטנים, סוציולוגים וקרימינולוגים.
    • ועדה שכזו גם תקבל גישה מלאה לביקורת פיסית ואלקטרונית על איכות שמירת הנתונים שבמאגרים הממשלתיים, ובמיוחד אלו האישיים של אזרחי המדינה. למשל כדי לגלות כיצד זולג לו מרשם התושבים לרשת האינטרנט כל שנה, ולוודא שמהיום והלאה כל עידכוניו והשליפות ממנו מוגבלות ומפוקחות, מתוך הבנה שברשת מקוונת אין כל סיבה להפיק את כל המאגר על דיסק שקל להעתיקו ולהפיצו לידי אויבי המדינה ופושעים ללא כל בקרת גישה.
  • הממשלה תפריד לאלתר את מספר הזהות כמזהה אישי וסודי של אדם מול גופי ממשל, בריאות וניהול פינאנסי (בנקים, ביטוח, מס' חבר קופ"ח) ובין זיהוי ציבורי (רשיון נהיגה, דרכון, מס' עוסק מורשה, מס' אישי בצבא) ותאסור על גופים אחרים לדרוש, לשמור על הנתון הזה ולהצליב איתו מידע לאף שימוש (כרטיסי חבר בסופרמרקט או תעודות חבר מועדון לדוגמא).
    • לא תתיר הממשלה, במעשה או מחדל, לגופים ממשלתיים או פרטיים, לפרסם את פרטיהם האישיים של אזרחים ללא אישורם, במיוחד אם אלו נגזרו מתוך מאגר ממשלתי שנמסר לרשותם מתוקף תפקידם בשירות האזרח (מוסדות פיננסיים כבנקים, חברות ביטוח, חברות נתוני אשראי וכיוצא בהללו). (הרחבה לחוק מסדי נתונים?)

זו, כאמור, רשימה חלקית וראשונית. אני אשמח שיאמץ את הרעיון איזשהוא צוות שיעבה את זה להצעת חוק כדי שיהיה מה לשלוח לנבחרינו. אולי העמותה חדשה לזכויות דיגיטליות?

עם צבת לא תוציאו

פשוט מגוחך לקרוא את ההתחמקויות של עירית תל אביב שדחפו ליצירת התקציבולטור. איך עם תקציב של 4.5 מליארד אין אפשרות להוציא מהמיינפריים קובץ יעיל? אנשי "עיר לכולנו" מייחסים את זה לתחמנות ואולי שחיתות, אבל כמו שאומר הפתגם "לעולם אל תייחס תחכום מרושע למה שבקלות יכול להיות סתם טפשות אנושית". התשובה לדעתי איפשהוא באמצע, כי הנה סיפור מעניין ששמעתי לפני שנה:

רוב המשכורות בארץ משולמות ומנוהלות ע"י המיינפריימים של מל"ם. מדובר במערכות כל כך ותיקות שאין כמעט תוכניתנים שיודעים לשפר ולתקן את התוכנות, מה שגורם למספר תופעות מוזרות להתקע ולהתאבן במערכת:
1. לא מתעדכנים לתוך המערכת חוקי מס חדשים, יוצא שהעובדים ו/או המעסיקים שמשתמשים במערכת (20% מהעובדים בארץ, אומרים לי) משלמים יותר מדי או פחות מדי מס.
2. מס הכנסה התאים את התוכנות שלו לקבצים של מל"ם כי כאמור המערכת ישנה מדי מכדי לעשות את ההפך.
3. הפורמט האיום של הקבצים מתועד חלקית, הטקסטים בקידוד EBCDIC או משהו דומה טרום-ASCII, ולא פשוט לעבד אותם כדי להוציא מהם נתונים לתוכנות אחרות.

אני יודע את זה כי אני מכיר בית תוכנה שישב ועשה את השירות הזה לקבצי המחשב של עירית תל אביב למרות הקשיים, השיגו את מפרט הפורמט של הקובץ דרך טובות אישיות וקשרים, בדקו את התוצאות מול חוקי המס המעודכנים, הצליבו את כל המידע לגבי עובדי עיריה שרשומים כתושבים באילת וכל מני עיירות פיתוח, או כל מני מצבים אחרים שלעיריה מגיע החזרי מס עליהם, והמסקנה היתה שלעיריה הגיעו החזרים של בערך 20,000,000 ש"ח מרשויות המס. זה בלי לבדוק אם גם לעובדים יש אי אילו החזרי מס שהם לא יודעים שמגיעים להם. 20 מליון זה רק מבדיקת תשלומי המשכורות לעובדי העיריה ב7 השנים האחרונות, עליהן אפשר להגיש בקשת תיקון והחזר מרשויות המס.

אבל אני בטוח שזה קצה הקרחון. יש במשק שלנו הרבה גופים עתיקים עם מערכות עתיקות, אני בטוח שסכומים נאים אפשר למצוא מתחת לבלאטות של הרבה עיריות ומועצות מקומיות. כמו שאתם מבינים, אף אחד במל"ם או אצל הלקוחות לא מרגיש שזה שווה לנקוף אצבע כדי להזיז את המצב. אולי יש פונקציות ששווה להפריט ואחרות שלא? אני לא כלכלן ולא חקרתי את הנושא, אבל אני חושד שבין הפרטה מלאה של עיריה לבין המצב הנוכחי, יש איזה קו באמצע שישפר את היעילות ויביא שקיפות, אבל לא יהרוס את הדברים הטובים שכן עובדים ואסור שינוהלו מתוך אינטרסים קפיטליסטיים בלבד.

דבר אחרון – שמחתי לראות איך אנשים יוצאים מהחורים פתאום. ארגונים כמו התנועה לחופש המידע שפעם פניתי אליהם לחפש שיתוף פעולה לגבי הפרויקט שהפך להיות ברבות הימים OpenKnesset, פתאום קופצים על התקציבולטור כמוצאים שלל רב ושמחים להודיע כי הם ידאגו לשפר ולהפיץ את הכלי. אני מבקש רק דבר אחד אם אפשר – עכשיו כשיתחילו אולי למצוא תקציב להמשך הפיתוח, עזבו את האקסל ועברו לכלים פתוחים בבקשה. המידע חייב להיות חופשי, מופץ בפרוטוקולים תקניים, והקבצים או התצוגה שלו חייבים להיות בפורמט פתוח שניתן לניהול וטיפול על ידי תוכנה חופשית. להתחיל מאקסל זה להוציא רגל מהבטון ולהכניס אותה לבוץ. לא עדיף להתחיל ולהמשיך פתוח מכאן והלאה?

אמנת ACTA נחשפת כהרחבה בינלאומית של חוקי קופירייט

אם למישהו עוד היה ספק עד כמה רחוק יגיעו זרועותיו של ההון להשפיע על השילטון: דלף אתמול בבלוג של מייקל גייסט שבאמנה בינלאומית נגד זיוף הוכנסו כמה וכמה סעיפים דרקוניים להחריד למניעת עבירות העתקה. הנה הפרשנות מבוינגבוינג:

  • ספקי שירות יחויבו לנטר כל חומר שיועלה ע"י משתמשים כדי לוודא אם יש בו משום עבירה על חוקי הקופירייט – זה אומר ששירותים כמו פליקר, יוטיוב, ובלוגיות כמו בלוגלי, ישרא וכולי יסגרו מהר מאוד כשיתברר שזה לא רווחי להחזיק צבא עורכי דין כדי לוודא את האכיפה.
  • ספק אינטרנט שנמסר לו שמשתמש שלו עובר על החוק מחויב לנתק אותו מיד, מה שאומר שאותו אדם וכל משפחתו יהיו מנועים מלגשת למידע חיוני לחינוך, בריאות ושירותים בסיסיים אחרים, ללא משפט ובירור.
  • כל העולם צריך לאמץ את המדיניות האמריקנית של "הודעה והורדה" ללא בירור ומשפט, מה שאומר למעשה צנזורה קלה ע"י לחיצה קלה על כפתור "עבירת קופירייט"
  • חובה על כל המדינות החתומות לאכוף DRM – אסור לנסות לפצח אותו ולהעתיק את החומר המוגן אפילו אם אתה היוצר שלו! זה אומר גם שאסור לתרגם את החומר לפורמט אחר כדי לעזור לאנשים עם מוגבלויות וכולי.

בוינגבוינג מפוחדים או שבחרו בכוונה בטון מוגזם, אבל אני לא חושב שהמצב עד כדי כך גרוע, כי לא ברור שכל המדינות יהיו מוכנות לחתום על ההסכם, ולא ברור שהוא יהיה חוקי או בר יישום בכלל. הבעיה היא שאין לי מושג באמת עד כמה מחייבות אמנות עם סעיפים כאלו, והאם ישראל מחויבת לזה וכולי. מה שבטוח הוא שזה צעד בכיוון מאוד גרוע מבחינת זכויות המשתמשים וגם זכויות היוצרים, וזה הופך את זכויות המפיצים למשהו שדורס כבר זכויות פרט (כולל פרטיות וחופש הדיבור) ברמות חדשות של עוצמה. מפחיד ומטריד מאוד.

דעות חמורות נוספות מפרסם ה-EFF ומקביליו באוסטרליה וניו-זילנד, הנה סקירה של IDG, האפינגטון ואחרים. בוודאי יצוצו עוד בשעות והימים הקרובים. תודה לקשבינו שי שהביא את הידיעה לשולחן המערכת :-)

כאמור, ההדלפה הראשונה על הענין הגיעה ממייקל גייסט, פרופסור למשפטים בקנדה שהנהיג שם את המאבק בחוק הDMCA הבעייתי. אפשר למצוא בערוץ בליפ.טיוי שלו המון חומר מעניין כדי להבין למה קופירייט זה דבר חשוב מחד אבל מסוכן מאידך וחשוב לשמור על האיזון בחוק, אני מציע לכל המעוניינים את הסרט "למה קופירייט", אם יש לכם 55 דקות פנויות.