סוגשל תגובה ממשרד התחבורה

למי שלא עוקב אחרי הסאגה: לפני שנה וחצי פניתי לממונה על חופש המידע במשרד התחבורה, הגברת אפרת קילשטוק, בבקשה להבין קצת יותר אודות המאגר הביומטרי של תמונות הנהגים שהם אוספים מזה מספר שנים לצרכי הרשיון. אני מניח שכולכם יודעים שבניגוד למשרד הפנים שעד עתה דרש מכל אזרח להביא בעצמו תמונות מפוטורצח, משרד התחבורה מקפיד לצלם אותנו דיגיטלית בעצמו מזה מספר שנים. המגמה שהפריע לי ולאחרים היא שמאיזשהוא שלב שודרגו איכות התמונה להתאים לדרישות של תמונה ביומטרית, ואיתן עלתה גם הרזולוציה. במקביל פרסם משרד התחבורה בגאווה כי התמונות מסייעות לזהות בדיוק רב את בעל התעודה בשיטות ממוחשבות חדשניות, או במילים אחרות, זהו מאגר של תמונות ביומטריות.

כיוון שמעולם לא הודה המשרד שהופעלו תוכנות ניתוח ביומטריות על התמונות, ולכן המאגר אינו "מאגר ביומטרי". זה נכון מבחינת ההגדרה המשפטית אולי, אבל טכנית התמונות הן ברזולוציה גבוהה ומינימום צלליות וכולי, כך שכל מי שיקבל לידיו את המאגר יוכל לעשות בו בקלות רבה שימושים ביומטריים. מי קיבל אותו לידיו? ובכן, יש לנו עדויות שמסופי משרד הפנים מקפיצים על מסכי הפקידים את התמונות האלו, ואנו יכולים להניח שגם למשטרה וגופים אחרים יש גישה למאגר או עותק שלו, ולמשרד התחבורה אין באמת שליטה על אילו ניתוחים ושימושים נעשים על המאגר. לכן הגשתי את הבקשה, שלצערי עד היום נענתה בנפנוף עד זריקת התירוץ של אבטחת מידע כסיבה לא לתת לי תשובה, למרות שזו אינה אחת העילות החוקיות לסירוב לפי חוק חופש המידע.

אחרי התערבות של התנועה לחופש המידע והתנועה לזכויות דיגיטליות והבהרה כי לא נעזוב את הסיפור גם במחיר הגשת עתירה משפטית, משרד התחבורה נתן לנו בסוף מאי את התשובה הכי מפורטת שהוא יכול להרשות לעצמו, ובה הוא לא ממש עונה על משהו משאלותינו, ומתחמק מהדברים החשובים.

אני אפרק כאן אחת לאחת את השאלות והתשובות לכל סעיף, למען יופיעו בטקסט בשביל גוגל ולא רק כ-PDF

ראשית, יש להסיר טעות ולהבהיר, כפי שציינתי במכתבי הקודם, מאגר התמונות של משרד התחבורה אינו מאגר הביומטרי במובן המקצועי של מונח זה. הטעות כאילו הוא כן ביומטרי, נובעת ככל הנראה מפרסומים שונים בנושא זה על תוכניות שאליהן התייחסת בפנייתך, אך לא מומשו בפועל

אכן, כמו שאמרנו בפעם הקודמת שאני ודורון קיבלנו את התגובה הזו, התמונות ביומטריות, המאגר איננו ביומטרי. משרד התחבורה ממשיך להתמם או שבאמת אין האנשים שם מבינים את הבעיה. המאגר איננו ביומטרי בידיים של משרד התחבורה אבל מרגע שישנה את דעתו או שהועבר עותק שלו למשרדים אחרים או למשטרה, הוא יכול להפוך במטה קסמים למאגר ביומטרי שאין אף אחד יודע או מפקח עליו באותה הרמה שחוק המאגר הביומטרי של משרד הפנים מקפיד. זה צריך להטריד אותנו, ולמעשה גם את משרד הפנים, כי זה מחליש את סודיות המאגר שלו.

ונעבור לפירוט התשובות שלהם לכל אחד מסעיפי הפניה ה"מעצבנת" שלי:

1. מהם הצווים או התקנות שהביאו להקמתו ומגדירים את ניהולו של המאגר החדש?

תמונות ממוחשבות ניטלות ע"פ תקנה 174א' לתקנות התעבורה, כפי שכבר נאמר במכתבי אליך מיום 18/2/10.

את התשובה הזו אכן כבר קיבלתי ופסלתי, ועניתי להם עליה כמפורט כאן. התקנה לא דורשת איכות ביומטרית, אינה מגדירה שלמשרד התחבורה מותר לשמור מאגר של תמונות, ובהחלט לא מדברת על השאלה של עם מי לחלוק את המאגר ובאילו תנאים.

2. מתי הוצאו הצווים ומתי התחיל היישום?

התקנה הותקנה לראשונה בשנת 1994, ותוקנה ב-1998 וב-2005. יישום הסבב הנוכחי של צילום התמונות של ציבור הנהגים החל ביולי 2006 (צילום חובה החל משנת 1994).

במילים אחרות, כבר חמש שנים שיש מאגר ביומטרי שהולך ותופח, ומועבר לגופים מחוץ למשרד התחבורה.

3. מה גודל המאגר כיום? (מס' רשומות, גיגה-בייטים)

במאגר מצויים כ-3.5 מליון תמונות נהגים.

ועד כמה שאנחנו יודעים, כנראה שכל התמונות האלו נמצאות גם זמינות למשטרה.

4. מה היא איכות התמונות הנשמרות ובאיזה פורמט?

התמונות נשמרות ב-jpeg, בנפח קטן עד 50k

קיוויתי לשמוע על מגהפיקסלים, אבל לפי הערכתי מדובר בכל זאת באיכות ביומטרית, בהנחה שהתמונות הן בערך 2MP.

5. מה היא התשתית הטכנולוגית שבאמצעותה מנוהל המאגר? אשמח לפירוט תוכנות ניהול מסד הנתונים, רמות הצפנה של המידע והתקשורת, גישה ישירה דרך האינטרנט הציבורי לספקים חוץ-ממשלתיים.

כפי שנכתב במכתבי הקודם אליך, אין לציבור גישה למאגר דרך האינטרנט, יתר הפרטים חסויים מטעמי אבטחת מידע.

טוב, את זה אנחנו כבר גילינו כשהלכתי להצטלם בחנות (זוכרים את הסרטון?) ואז כששלפו והדפיסו את התמונה בסניף של איסתא. נראה שהעמדות מחוברות דרך האינטרנט הציבורי, הגישה שלהן למאגר כדי להעלות ולהוריד תמונות מוצפן על גבי HTTPS לכתובת באתר משרד התחבורה (שוידאתי שנגישה גם מאצלי בבית), וההזדהות מול המאגר דורשת שימוש במספר ח"פ המשתנה כל כמה דקה מהתקן Security Token שנמצא על מחזיק המפתחות של המפעילים המוסמכים. זהו התקן לא מושלם אבל לא רע.

הבעיה האמיתית בתשובה הזו היא הסתרת המידע כדי לשמור על הבטחון. לא ביקשתי לדעת את מפתח ההצפנה אלא את שיטות העבודה. שיטות טובות לא אמורות להיות פגיעות בגלל שמספרים מה הן. לפי הביקורת הנפוצה נגד אבטחה באמצעות עמימות, גוף ששומר על המידע ×”×–×” בסוד לא מבין מה הוא עושה – או יותר גרוע, מפעיל שיטות אבטחה גרועות ולא מבין מה הוא עושה. הנוהלים והאבטחה הוקמו בוודאי ומתוחזקים ×¢"×™ מרמנת או אחד הספקים החיצוניים של המשרד, ונשמע כאילו המשרד בעצמו סומך עליהם בעיניים עצומות. לא מתאים לי.

6. מי הגופים/ספקים המופקדים על ניהול תשתית המידע והתקשורת מלבד צוות המשרד?

אין גופים נוספים המופקדים על ניהול תשתית המידע מלבד צוות המשרד.

מדאיג או מרגיע בהתחשב במה שהם מספרים? תחליטו לבד.

7. כל כמה זמן נערכות בדיקות אבטחה למערכת, ע"י מי? האם תוכלו לפרסם את תוצאות הבדיקות?

בדיקות אבטחת המערכת נערכות מפעם לפעם ע"פ הוראה הניתנת ע"י הממונה על אבטחת המידע במשרד. תוצאות הבדיקות אינן לפרסום מטעמי אבטחת מידע

נראה שאין שומרים על השומרים, ואין שקיפות, אז אין מול מי להצטדק אם יש בעיות.

8. התפרסם באתרכם ובמקומות אחרים כי המאגר הקיים נגיש למספר גופי ממשלה וחברות פרטיות. למי יש גישה לנתוני המאגר ולאילו שימושים?

המאגר אינו נגיש לחברות פרטיות. לגופי ממשלה בודדים שאושרו לפי פרק ד' לחוק הגנת הפרטיות, מאפשרים לשאול שאילתות פרטניות. פירוט הגופים המאושרים חסוי מטעמי אבטחת מידע ובטחון.

במילים אחרות, לדעתי סביר להניח שלמשטרה ולשב"כ יש עותקים מהמאגר, והם בוודאי מתעדכנים מפעם לפעם. אני חושב שאפשר לשאול שאלות הבהרה כמו כמה פרטניות השליפות וכמה שליפות כאלו בשנה מתרחשות, אבל אני מנחש ששוב ינפנפו אותנו "מטעמי אבטחת מידע".

9. האם גופים חיצוניים מחוברים באופן מקוון? באיזו איכות נשלחים לחברות אלו קבצי התמונות? אילו עיבודים, ניתוחים או הפקות מידע ביומטרי נעשים היום על המאגר ע"י משרד התחבורה ושאר הגופים איתם הוא חולק את המידע?

לא נעשים עיבודים, ניתוחים וכיו"ב על המאגר של המשרד

אף מילה על מה עושים גופים אחרים שמחזיקים עותקים מעודכנים יותר או פחות של המאגר.

10. מה הם התנאים לקבלת גישה למאגר ואילו אמצעי פיקוח קיימים על הגופים שקיבלו גישה עד היום?

עמידה בפרק ד' לחוק הגנת הפרטיות והפיקוח הוא על פי האמור בחוק זה.

פרק ד' לחוק הגנת הפרטיות מציין בין השאר כך:

חובותיו של גוף ציבורי
23ד. (א) גוף ציבורי המוסר דרך קבע מידע בהתאם לסעיף 23ג יפרט עובדה זו על כל דרישת מידע בהתאם לחוק.
(ב) גוף ציבורי המוסר מידע בהתאם לסעיף 23ג יקיים רישום של המידע שנמסר.
(ג) גוף ציבורי המקבל דרך קבע מידע בהתאם לסעיף 23ג, והמידע נאגר במאגר מידע, יודיע על כך לרשם ועובדה זו תיכלל בפרטי רשימת מאגרי המידע לפי סעיף 12.
(ד) גוף ציבורי שקיבל מידע בהתאם לסעיף 23ג לא יעשה בו שימוש אלא במסגרת הסמכויות או התפקידים שלו.

תשמעו, אני לא עורך דין, אבל אני יכול להשבע שכתוב פה שגם משרד התחבורה וגם חבריהם למיטה חייבים לפרסם שהם מקיימים יחסים.

11. האם ידוע על דליפה של עותקים מלאים או חלקיים של מידע ממאגר התמונות? כיצד טופלה הבעיה?

לא ידוע במשרדינו על דליפה מהמאגר.

12. מהו הנוהל שהכין המשרד לטיפול במקרה של דליפה?

אופן הטיפול בדליפה, אם תהיה, חסוי מטעמי אבטחת מידע.

מטריד משהו, עכשיו אני תוהה האם יש להם בכלל נוהל כזה?

13. כיצד נערך משרד התחבורה לתיקון כל הנהלים הנ"ל כתוצאה מהחקיקה החדשה?

החוק ×”× "ל (הכללת אמצעים ביומטריים וגו' – ×¢.א.) אינו רלוונטי למאגר התמונות של המשרד

אולי, אבל המאגר של המשרד בהחלט רלוונטי לבטיחותו של המאגר הביומטרי של המשטרה של משרד הפנים. מישהו צריך לפעול בנושא ויפה שנה אחת קודם.

14. אם אווכח שאני מודאג מהתנהלות המאגר, אוכל לבקש שתמונתי תוסר ממנו? אני מבין שבזה עלול להיות כרוך ויתור על רשיון הנהיגה שלי, אך ברצוני לוודא שאני לא אקריב אותו לחינם, ותמונתי אכן תוסר אם אבקש.

כפי שנכתב במכתבי מיום 18/2/10, על פי תקנה 174א' לתקנות התעבורה רשיון הנהיגה חייב להיות רשיון עם תמונה ממוחשבת, לכן לא ניתן להסיר את התמונה ולהפיק רשיון מחודש ללא תמונה.

תשובה מדויקת – אבל לא לשאלה ששאלתי! לא משנה, ×–×” לא שאני באמת יכול להרשות לעצמי להסתובב במדינה הזו ללא רשיון כשאין תשתית תח"צ מוצלחת.

קוריוז לסיום – המכתב הקצר ×”×–×” עלה לי בהרבה המתנה, תסכול ואגרה של תשעים ומשהו ש"×—. צבי דביר מהתנועה לזכויות דיגיטליות השקיע הרבה יותר מאמצים במכתב מפורש ומנוסח כדבעי שבו הראה לקילשטוק וצוותה מהיכן מטיל הדג את מימיו, כולל ציטוטי שופטים על חשיבות השקיפות השלטונית וכולי. במכתב התגובה קילשטוק מציינת אותו בתור עורך דין והדבר הצחיק אותו, אבל בינינו, אם הייתם רואים מה הוא שלח לה, הייתם מסכימים שהוא כנראה עו"ד בנשמתו לפחות. בין עורך דין אמיתי ל"עורך הדין" דביר פרץ ויכוח את מי התואר ×”×–×” מעליב יותר (את עורכי הדין או את צבי). תוצאות יפורסמו במדורי הרכילות.

עכשיו רק נשאר להחליט אם מבקשים מהם עוד סבב של הבהרות או שאנחנו מרגישים שיש כאן מספיק חומר לצאת לעתירה על השערוריה הזו.

הפיילוט בדרך, הכינו את המסכות

מפגינים ברחבת הסינמטקכמו שהבטחתי, שרפתי יום עבודה, נסעתי לירושלים והצטרפתי לחבורת המתנגדים הקולניים של דרום שולחן ועדת המדע. הצד הדרומי מאופין במתנגדי המאגר (עו"ד שופמן, קלינגר, פינצ'וק וחי), כתבים, נציגי קבוצות ענין שונות, ואני, נציג התנועה לזכויות דיגיטליות (כמו קלינגר). אצלנו תראו לאפטופים והרבה ניירות, בצד הצפוני תמצאו מעט ניירות והרבה עייפות, לאפטופ אחד בלבד (של יורם אורן) ודורון שקמוני שכנראה לא מצא פשוט מקום בצד הדרומי 🙂

לא באנו להרוס את המאגר הביומטרי, בזה נכשלנו כבר לפני שנתיים. החוק כבר עבר, מרכז ההנפקות הוקם, חומרי הגלם נקנו, האנשים נשכרו. אנחנו באנו כדי לשאול איפה השקיפות, לאן נעלמו אמצעי ×”×”×’× ×” על הפרטיות (וקיבלנו תשובה שהם לא היו טובים. למי? למשטרה כמובן) ולהראות שהתקנות והצו אינם בשלים, בתקווה להראות בהם כמה חורים. אחרי 14 חודש, הגיש משרד הפנים את התקנות שלפי החוק ×”×™×” אמור להגיש אחרי ארבעה. היו שם כמה חורים וחוסרים, אבל הדבר היחידי שלא יכולנו לשנות שם באמת, ×–×” שאין הפרדת מסדים (שנרמזה בחוק) ואין עמעום (כמו שהובטח בפגישות שונות). גם אין תקן להצלחה או כשלון של הפיילוט. זאת אומרת, יש כל מני מדדים כדי לקבל משוב אם הזיהוי עובד טוב, כמה False Rejects או False Accepts יש, האם באמת נמנעת הרכשה כפולה וכולי, אבל לא הוגדרה קבוצת ביקורת, לא הוגדר מדגם שייצג מספיק אזרחים בכלל ומגוון של קבוצות אתניות בפרט (לבדוק את ×”×”× ×—×” ששונות ביומטרית קיימת בצורה שווה בקבוצות שונות). ביקשתי לדעת אם סופרים כמה אנשים שהציעו להם את הפיילוט מסרבים, ועשו לי פרצוף, אז קלינגר הרביץ בהם תורה ונכנעו. הבעיה שבלטה לנו היא שכאשר מסתכלים על כל המדדים, עדיין לא הוגדרו שם מראש סיפים שמעליהם או מתחתיהם הפיילוט יוגדר ככשלון. "מה זאת אומרת להגדיר מראש את הסיפים?!" רעם שטרית כשהעלינו את ×–×” – "קודם נראה את התוצאות ואז יחליט השר אם ×–×” מספק או לא!". פייספאלם. הזכרתי למר שטרית את עברו האקדמי במדעי החיים, ×›×›×” לא עושים ניסוי, וכאן התחילה המולה של כדקה שלמה של חילופי צעקות בינו לבין קלינגר ופינצ'וק, "×–×” מאגר, לא מחקר!" – "אבל פיילוט משמעו ניסוי וצריך לקבוע פרמטרים להצלחה!". בקיצור לא ברור מה הפיילוט בודק. בחוק כתוב מה הוא אמור לבדוק, אבל הצו, למרות כמה תיקונים, עדיין לא אומר הרבה. המשמעות ברורה, הפיילוט לא יכשל, ×›×™ אין לו מה להוכיח. שטרית אמר את ×–×” יפה שלוש או ארבע פעמים "אם ×–×” ×”×™×” תלוי בי בכלל לא ×”×™×” פה פיילוט".

שטרית פותח את הישיבה בהזהרה שלא מדסקסים את החוק היום אלא רק את התקנות, ומבקש להתקיף את המבקרים. עוד לא הוצאנו מילה… #no2bio

בציוץ ×”×–×” פתחתי את הדיווח. בתור דברי פתיחה, שטרית כבר קבע טון התקפי. אני חושב שזה לא עבד עלינו, אבל דבר אחד ×”×™×” לו – תשובה לכמה מטענותינו הישנות, ובראשן טענתינו שאין מאגרים ביומטריים חובה במערב. אז זהו שבינתיים יש בהודו, אבל הוא ויורם אורן חידשו לנו גם על מקסיקו, פרו, קולומביה, ספרד ופורטוגל. צריך לבדוק את ×–×” אבל אם ×–×” אכן המצב, שיש מדינות שבהן בלי להכנס למאגר לא מקבלים זכויות אזרח/תושב כמו ביטוח לאומי וזכות תושב, אז כנראה אנחנו באמת כבר לא הראשונים. לדעתי ×–×” לא מחליש את העובדה שאנחנו לא רוצים או צריכים מאגר, ×–×” רק מבטל את טענת ×”"יחידים בעולם ש-". מצד שני, ×™×”×™×” טוב לפקוח עין על פרסומים מהמדינות האלו על בעיות ביישום, ואם למישהו יש יכולת טובה בפורטוגזית ו/או ספרדית ויכול למצוא לנו איך הולך בדיוק היישום שם, אני אשמח לעזרה בריכוז החומר.

שאלנו את שטרית למה אנחנו רואים את התקנות רק שלושה ימים לפני ישיבה, והסתבר לנו שגם אנשי ממשל מסביבנו היו באותו המצב. עברנו לשאול למה השושו, ולמה הפגישות הסודיות. שטרית נבח שלא היו ישיבות סודיות ושאני שקרן ("טועה" ו"שקרן" חזרו הרבה בפיו היום לסירוגין). אחרי הישיבה שאלתי אותו שוב לגבי הישיבה מה-22 לנובמבר, והפרוטוקול שדלף – "אה! זאת היתה רק התייעצות, לא "ישיבההה" ולכן לא הוזמנו אנשים!". קוראים יקרים, איך הייתם קוראים לכ-20 אנשים היושבים בחדר הועדה לשעתיים או אולי יותר, ומייצרים פרוטוקול אך לא מפרסמים אותו? האם זו "התייעצות פעוטה" או ישיבה סודית?

לאחר שהשתיק את פינצ'וק בנביחות, שטרית נותן בכ"×– לשופמן (יו"ר המועצה הציבורית להגנה על הפרטיות) לשאול את אותה השאלה – למה לא פורסמו התקנות בגרסאות שונות של הטיוטא לעיני הציבור. שטרית בחיוך מדושן: "לפעמים מפרסמים תקנות לפני ההצבעה בכנסת ולפעמים לא". חבל שאין איזה חוק מסודר באמת. oh well…

ריב נביחות נוסף התפרץ כשהזכרנו שדלף מרשם התושבים. שטרית נפנף אותנו ואמר שזה "רק" פנקס הבוחרים, אבל אני יודע מה אני ראיתי בעיני – תוכנה שהכילה גם קטינים, שמות של לפני נישואין, קשרי משפחה, שמות קרובים מתים או שלא עלו לארץ ואין להם תעודות זהות, והכי מענין – משפחות שלמות מחוקות (הניחוש שלי הוא שמישהו במשפחה גויס לשירות שושואיסטי כלשהוא). למכר שלי היו ערימה של תקליטורים של האגרון ×”×–×” משנים שונות, כך הוא גילה שיש משפחות שנעלמות אחרי שנה מסוימת. לא ברור איך ומאיפה ×–×” דולף, המשטרה פתחה וסגרה חקירה, אבל שטרית מכחיש שזה בכלל קרה.

בהמשך עלה דיון על זה שאין הגדרה מהו מידע רגיש ועם אילו שאלות זיהוי מותר לפקיד משרד הפנים לפקפק בזהותך ועד כמה מותר לו לחדור לפרטיותך. הצו ביקש להביא בפני הפקיד המתחקר פרטי מידע שרק אתה תדע, מכל מאגר ממשלתי שזמין לו. זה אומר לא רק מה היה שם הסבתא לפני הנישואין, אבל אולי גם מידע כלכלי, רפואי וכולי. קלינגר, פינצ'וק ושופמן כמובן קפצו במקהלה ואני שמח שהתגלתה לקונה רצינית בלשון הצו, חייבים הגדרה של מידע הנוגע לצנעת הפרט לפני שאפשר לפלוש ככה. משרד הפנים הסכים על כמה קטגוריות כמו מידע רפואי שזה אכן מוגזם, והם ינסחו יותר במדויק מאיפה יגיעו השאלות האקראיות האלו. מעט מאוד סעיפים זכו לשכתוב שכזה, רובם חלפו ביעף בהצבעות פה אחד של היו"ר, כמו שהכרנו את הישיבות איתו לפני שנתיים.

בצו מפורטים התקנים לתמונות ולטביעות אצבע, אבל החור מדבר על תמונות באיכות מופחתת שאפשר ×™×”×™×” להעביר לגופים אחרים לצורך זיהוי ויזואלי אנושי, אבל אינן מפורטות מספיק בשביל זיהוי ודאי עם אלגוריתם ביומטרי. מסתבר שאין תקן ISO ל"תמונות מופחתות", אולי צריך שיהיה? סוגיה אחרת הועלתה ×¢"×™ מתנחל מהשומרון – מה לגבי אישה שמצלמת גבר? אישה שמצולמת ×¢"×™ גבר? משרד הפנים גמגמו שבסניפים קטנים אולי לא ×™×”×™×” מבחר צלמים מכל שמונת המינים, אבל תהיה השתדלות למען כולם. לא הבנתי מה הצעיר ×”×–×” עושה פה עד אחרי הישיבה, נראה שהוא אחד מהחבר'×” הטובים שלנו, ודואג מכל הצילומים שיוכלו לזהות אותו ואת חבריו בעת פינוי מאחזים. לא הצלחתי להבין אם ×›×›×” למה דווקא אלו השאלות שהטרידו אותו בישיבה, לכל אחד יש מבחר גירודים בגלל החוק ×”×–×”, לא על אותן הבעיות, אני מניח.

בשלב הבא דיסקסנו הלכות מחיקה. מתי למחוק את הנתונים שנרכשו וצריכים להמחק בצורתם הלא-מוצפנת? מחיקה אוטומטית או מחיקה ידנית? יש תקנים למחיקה, האם הם ייושמו? מתי מחיקה היא איכותית וראויה להקרא מחיקה? האם זה מובן מאליו שתהיה מחיקה איכותית ואפשר למחוק את דרשת המחיקה מהצו, או שמא הצו צריך להגדיר מתי מחיקה היא מחיקה מחיקתית? במשך כעשר דקות או יותר המשיכה שמחת בית המחיקה הזו בין קלינגר ליורם אורן, לשקמוני ושטרית, ואני מתאפק לא להתפוצץ מצחוק (למרות שהנושא חשוב!) כי הקטע הישן הזה רץ לי בראש:

בשלב הזה הגענו לדבר על ענין הדוח התקופתי (מדדי הרשמה, הצלחות וכישלונות הרכשה, זיהוי, מניעת כפילות, וכולי). מנהלת המאגר אמורה להגיש לועדה דוחות חצי שנתיים. ביקשתי שיופיע בצו כי הדוחות יפורסמו לציבור, ושטרית, כמעט נעלב, הודיע שהועדה פתוחה לציבור הרחב וכל דוח שיוגש כמובן יפורסם. עם זאת הוא לא היה מוכן שזה יופיע מפורשות בצו, אז יש לנו את ההבטחה הזו רק בפרוטוקול. אני אופתע מאוד לטובה אם נראה את הדוחות האלו במלואם. כאן חזרנו לדבר על הצעת שמיר או לא (למורת רוחו של שטרית זה עלה כמה פעמים), ולמרות שיורם אורן הסכים בלי סייג שמגירות של 700 איש (הצעת שמיר בעוד אחת מה"התייעצויות" שלא פורסמו להן פרוטוקולים) היו מספיק טובות סטטיסטית למניעת הרכשה כפולה, עדיין המאגר ישאר 1:1 בשביל המשטרה. שטרית אפילו לא היה מוכן לשמוע על בחינה במקביל למאגר את שיטת המגירות של שמיר, ולהחליט איזו מהשיטות מספיקה אחרי שנתיים פיילוט. שוב ושוב חזר שטרית על השטות שלא יתכן שהמשטרה תזמן 700 חשודים בגלל טביעת אצבע בודדת. לא שעה לטענותיהם החוזרות של קלינגר ואחרים כי תמיד אפשר להוריד סטטיסטית 90% לפחות מהשמות כי הם לא בגיל המתאים או לא גרים באיזור וכולי, חיתוכים בהתאם לסיטואציה שממנה נלקחה דגימת האצבע שהמשטרה רוצה לזהות. שקמוני אפילו הזכיר שבאחת מהישיבות הראשונות אמר ראש המז"פ שאיכות סריקת האצבעות של המאגר ממילא הופכת אותו ללא שמישה למשטרה לצרכי זיהוי מזירת פשע. אם כך אני לא מבין למה הויכוח? השאלה נשארה באוויר. לא הצלחתי להכניס מילה בשלב הזה, אבל אם היתה ניתנת ההזדמנות הייתי אומר פשוט שזו לא בעיה של האזרח, היא בעיה של המשטרה. להתאים טביעות לאדם הנכון, לזהות עבריין לפי שחזור תווי פנים ע"י עד, לקבל עשרות תוצאות מבקשת נתוני מיקום סלולארי ולהבין מתוכם מי רלוונטי. המשטרה צריכה לשפר את יכולותיה אבל למה על חשבון הפרטיות של האזרחים שהיא אמורה להגן עליהם?

מדינת מעקב

בנושאים טכניים אחרים אני עוד אשלח שאלות ליורם אורן בנפרד. למשל תהיתי למה צריך שהנתונים יהיו מפוענחים במרכז ההנפקה (שעד כמה שהבנתי הוקם ומנוהל ×¢"×™ HP). הרי חשבתי שמדובר בצ'יפ חכם עם מעבד שיכול להצפין ולפענח, אז למה שלא יצפינו בעמדת ההרכשה עם מפתח ציבורי של כרטיס שמחכה במרכז ההנפקות, ושם הכרטיס יפענח את המידע המוצפן על הצ'יפ עצמו. יש עם ×–×” שתי בעיות – האחת היא שבשביל דרכונים חלק מהמידע ×”×–×” צריך לשבת בלתי מוצפן על הדרכון עצמו, תמונות מודפסות חייבות להיות בלתי מוצפנות כמובן, ולבסוף הצ'יפ שמספיק חזק לפענח את המידע שישאר עליו עצמו מיוצר קניינית רק ×¢"×™ יצרן אחד ולא רוצים להנעל עם ספק אחד ושיטה קניינית. אין מה לעשות כאן, לצערי אני מסכים. המשכתי להקשות איך אם כך יפעלו סורקים במשרדים והסורקים הניידים של השוטרים – הרי אם אין שם כוח חישוב, הסורק לא יכול לשלוח טביעת אצבע והשצ'יפ על הכרטיס יאשר את הזהות, צריך לחלץ את תמונת האצבע מהצ'יפ ולהשוות על המעבד החזק יותר בקורא – ובכן האם ×–×” אומר שכל קורא יחזיק את המפתח הסודי לכל תעודות הזהות? מה קורה אם הוא נגנב? יורם אורן הסביר שכל הסורקים יהיו מקוונים כל הזמן בשביל הפענוח, וסורק שאובד או נגנב מיד מוצא מהרשת, ועדיין לא הבנתי כמה קל או קשה ×™×”×™×” להזדהות מול כרטיסים עם סורק גנוב שנותח והוצא ממנו המפתח הסודי לתעודות הזהות. יש לזה פתרון קריפטוגראפי מעניין, ואני אבין אותו ממנו בהזדמנות. בשורה התחתונה – ×–×” לא מתחבר למאגר או משהו, אם תהיתם.

בדרך היו כל מיני חילופי דברים מצחיקים-עצובים. אני לא יודע אם הכל יפורט בפרוטוקול, אבל היו כמה ציטוטי זהב בסגנון כזה:
שטרית (על הצעה לתיקון כלשהיא): אני לא מסכים!
פינצ'וק: אז למה אתה כן מסכים?
שטרית: אני מסכים רק למה שיש בצו!

אחרי הישיבה נתקלתי באיש המאגר של משרד התחבורה. שאלתי אותו מה עושים עם המאגר הלא חוקי שלהם, והוא ענה שעובדים על תקנות לכסות אותו. הזכרתי שהיה כבר נסיון לחוקק אותו ונכשל, והרי אם ניסו לחוקק אזי הם מודים שהוא לא היה חוקי בלי אותה הצ"ח, ובוודאי שאינו חוקי מאז שהיא נכשלה, אבל לא קיבלתי תגובה ברורה. שאלתי אותו למי המאגר מועבר מלבד משרד הפנים והוא רק טען שזה מגובה בחוק העברת מידע בין משרדים כלשהוא. כשהתעקשתי שאני רוצה אם כך לדעת למי, ולמה שנה וחצי לא קיבלתי את תשובת משרד התחבורה לנושא, הוא אמר לי בחיוך ש"בשביל זה יש בית משפט, אל תשאל אותי". נראה שאין ברירה ואכן צריך להגיש עתירה אם זה היחס שהם הפגינו כלפי וכלפי צבי דביר מהתנועה לזכויות דיגיטליות.

תשובה דומה קיבלתי מעוד אדם (סליחה שלא ביררתי מי, אני חושב משרד הפנים) שהיה די ×¢×™×™×£ ממלחמת ההתשה של הפגישה. "למה לא תגישו בג"×¥? הרי מויכוחים כאן לא תתקבלו פתרון". מצד אחד צודק, מצד שני ההיבריס של האדם שרוצה שתעוף לו מהעיניים. ×”×’×™×¢ כנראה הזמן להגיש אותו, אני מקווה שיש משהו מתבשל, אבל אני לא מעורב בזה, ואם הייתי מעורב לא הייתי כותב על ×–×” 🙂

חילופי הדברים האחרונים שהצחיקו אותי היו עם אדם אחר ממשרד התחבורה שקיבל מצבי דביר את חוות דעת התנועה לזכויות דיגיטליות על כרטיסי הרב-קו, ושאל אם זה אני. הסברתי לו שאנחנו יותר מאדם או שניים או שלושה, ויש לנו גם מועצת מומחים המכילה את ביהם ועוד שמות. האיש הגיב בצורה מאוד מופתעת, הוא חשב שאנחנו שניים וחצי עושי-צרות בלבד, אני אשמח אם נפתיע ככה עוד אנשים, לעמותה הזו תהיה הרבה עבודה בשנים הקרובות, זה נראה לי.

הלכתי לישון, עייפים אך מיואשים. בנובמבר יתחילו להנפיק תעודות ביומטריות, ואם אכפת לכם, צריך לגייס טאלנטים ואולי כספים לקמפיין שיווק נגדי לזה שהמדינה תשיק. קחו את הפוסט ×”×–×” לפייסבוק (×›×™ אני לא יכול), ונסו לגייס אנשים שעושים טיפה יותר מללחוץ לייק. אודה לכם מראש…

ולפני שאשכח, האייטמים שהגיעו לעיתונות: טמקא, כלכליסט, דה מארקר, נרג'.

עדכון: עומר כביר מכלכליסט פתח בלוג משלו (תתחדש!) ופרסם אף הוא את רשמיו האישיים מהישיבה.

ועוד עדכוןרכילות עסיסית ממרכז ההנפקה בקיסריה שהביא דורון. א-ברוך.

עוד פרטים על חטיפת הפיילוט הביומטרי

ראשית, למי שרוצה סקירה מסכמת של הסיפור עד כה, הנה אייטם מוצלח למדי שפרסם בטאון הפאלון גונג "אפוק טיימס" בישראל. הלוואי שהעיתונים הגדולים היו משקיעים בהסברה טובה שכזו לקהל, עצוב שנושא זכויות האדם מכוסה טוב רק בפרסומים אינטרסנטיים שכאלו ולא במיינסטרים.

בשבוע שעבר הגישה טלילה נשר אייטם בגל"צ על ישיבת הקמת הפיילוט מנובמבר שהזכרתי פה לפני חודש:

[audio:http://ira.abramov.org/blog/wp-content/uploads/2011/04/BIODB_glz_2011-04-06.mp3]

לצערי לא פורסם פרוטוקול מלא של אותה הישיבה, רק סיכום דברים. בהתאם ללשון החוק, הישיבה הוגדרה בקלות כחסויה, ולכן מרגיז עוד יותר לראות שלא מסתירים כאן מידע בטחוני, אלא רק מסתירים איך שטרית מדיר את הציבור מהשיחה החשובה הזאת כדי להמנע משיקולים מוצדקים של שקיפות, פרטיות וכולי. נראה שהיו עוד 3 פגישות בשבוע שעבר, אני מקווה שאשיג סיכום או פרוטוקול שלהן. הבא ננתח את הישיבה מנובמבר:

סיכום דיון על אבטחת מידע מאגר ביומטרי - 22.11 עמוד 1

ראשית, שימו לב מי לא בקהל – הציבור וח"כים/שרים שמתנגדים למאגר בכלל והקמת פיילוט ללא העמעום בהתאמה שהציעו עדי שמיר, אור דונקלמן או אחרים, אם היו.

2.1 – מנכ"ל רשות האוכלוסין היקר, אם אתה מעונין לשמוע את דעת כל "המעורבים בפרויקט", למה לא עירבתם את הציבור שהוא נשוא המאגר? אני חושב שאנחנו "מעורבים" בו. סוגשל.

2.2 – אגף התקציבים (קרן טרנר) מתפלאים לגלות שההגנה על הפרטיות בעזרת שיטת שמיר, שהיה אחד המדדים להצלחה, בוטל כמדד ובוטל מהפיילוט – בגלל צרכי המשטרה. שימו לב לאורך כל המסמך שהמאגר כבר לא מתואר ככלי לשימוש משרד הפנים לאימות תעודות, השינויים מרחיקי הלכת בצורת בנית המאגר נעשו בצורה מפורשת לדרישת המשטרה. מה שאמרנו כל הזמן, ומה שאמר שמיר בכנס באוקטובר, המאגר ×”×–×” נדחף ×¢"×™ המשטרה אבל הועבר ×¢"×™ משרד הפנים, אחרת הוא לא ×”×™×” עובר. עכשיו משעבר, המשטרה לא מתביישת להתנהג כאילו היא הבעלים, כמו שתכננה מראש.

שימו לב לקוריוז – משרד האוצר נלחם על טובתינו, הלוט"ר והמשטרה נגדינו. "יום ההפך"?

2.3.2 – שטרית מגיב – שיטת שמיר היתה רק הבטחה ריקה באוויר, לא ממש בדקנו את ×–×” לעומק (×›×™ לא ממש התכוונו אי פעם ליישם את ×–×”, אני מניח…), ואחרי שהמשטרה הסבירה לו שזה מקלקל לה את השמחה, הוא "שינה את דעתו". כל מי שהיה בפגישות או קרא את הפרוטוקולים, יודע שמעולם לא היתה כוונה לעמעם את המאגר.

סיכום דיון על אבטחת מידע מאגר ביומטרי - 22.11 עמוד 2

2.3.3 – שטרית השמרן טוען שבאף מקום לא ניסו את שיטת הקבצים של שמיר – הוא לא טורח להזכיר שבאף מקום בעולם לא ניסו מאגר ×›×–×” על כלל האוכלוסיה. ×”×™! הזהירות שלו במקום, אבל שלנו לא?

2.3.6 – הקהל לא מתנגד "×›×™ יש לו אינטרס"? אני חושב שהקהל פשוט לא מודע לבעיות או שמציפים אותו בתמריצים, הפחדות ומסכי עשן. למשל זוגתי כרגע בין עבודות וחותמת בלשכה. בלי שהעליתי אפילו את הרעיון היא בחרה על דעתה לא לתת טביעת אצבע. עשו לה פרצופים ושכנועים אבל בסוף הסכימו ל"שגעון" של מובטל שלא משתמש במכונת האצבעות האוטומטית. ×–×” לא שהקהל לא דורש, ×–×” שהרשויות לא ממש מספרות על ההשלכות והאופציות – במסגרת טיעונינו לגבי שקיפות ושיתוף הציבור…

2.3.7 – התייחסות להצעת שמיר המתוקנת? הגבתי לה כאן כשהיא שיפרה את המאגר המעומעם, אבל איך בדיוק הוספת טביעות וצילומים למאגר 1:1 משנה משהו? ×›×™ ×–×” יוסיף false positives? לא ברור, אבל שטרית איננו מומחה בתחום, לא קריפטולוג ולא מדען מומחה בראיה ממוחשבת וזיהוי ביומטרי, אז אני לא מצפה ממנו "לעשות הגיון" בטיעונים שלו. הלוואי שכולם היו רואים את ×–×” כך…

2.4.1 – אם יודעים מי במגירה, סימן שכל המאגר נגנב ויש לנו צרות הרבה יותר גדולות.

2.4.2 – מצוין, גב' אבישר, המאגר ×”×–×” לא אמור לשרת את המשטרה ואנחנו בדיוק נגד ×–×” פועלים. אם המשטרה רוצה מאגר, שתחוקק אחד בעצמה!

2.5.2 – יורם אורן טוען שאפשר ×™×”×™×” לנייד אזרח בודד בין בגירות, אני תוהה איך יניידו את השם אחד ממאה ממגרה אחת, את התמונה וטביעת האצבע הנכונות מתוך מאה שבמגירה התואמת, אם אין התאמה 1:1? או שהוא צוחק עלינו או שהוא לא מבין את שיטת המגירות בעצמו. בכל אחד משני המקרים האלו אני חושב שזה אומר שאני מטיל ספק בהתאמתו לתפקיד ×”×–×”.

2.6.1 – הסבירות לבג"×¥ היא המדד? או שמא הדאגה לבטחון הציבור? נשמע כמו חישוב קר אם "שיטת מצליח" תצליח. ×’'יזס.

סיכום דיון על אבטחת מידע מאגר ביומטרי - 22.11 עמוד 3

2.7.5 – הבנתם? שיטת עמעום הזיהוי האישי וחשיפת הפרטיות בעצם פוגעת בפרטיות. טיעון שופע הבנה טכנולוגית ושימוש בלוגיקה מטעם ראש הלוט"ר, האנשים האמונים על הכנסת העם לפראנויה. אלו ראשי השועלים שאמורים לשמור על התחת שלנו.

3.1 – שטרית בכבודו מודה בפה מלא שהמערכת מיועדת לשימוש המשטרה ומערכת שתתן מענה למשרד הפנים בלבד ותגן על פרטיותינו אינה מעניינת את ישבנו הדשן.

3.1.4 – שטרית חוזר בו ונותן מס שפתיים – המאגר בעצם כן מיועד לשימוש משרד הפנים, בנוסף הוא שוב מצטט את המספר השקרי של 350K תעודות מזויפות. למי שלא עקב – יש הערכות של כמה עשרות אלפי מזויפות בלבד, 350K ×–×” מספר התעודות שדווחו כאבודות. הקמת המאגר איננה הדרך הטובה היחידה למנוע זיוף, תעודות חכמות היו מספיקות, ובוודאי שתעודות ביומטריות ללא מאגר היו מספיקות גם הן.

3.1.5 – איפה הערכת המומחה שתגבה את הטענה הזו? האם קריפטולוג זוכה פרס ישראל, פרס טיורינג ופרסים מקצועיים אחרים מבין בתחום פחות משטרית? האם המלצות רמו"ט ומועצת הפרטיות במשרד המשפטים זניחות? מה עם שיטות אחרות שהוצעו?

3.1.6 – נכון, קיימים מאגרים לא מקובצים. הם נאספים מפושעים ולא מכלל האזרחים, או שהם במדינות לא דמוקרטיות שעושות בהם שימוש לרעה.

3.1.7 – שוב, הסיכוי לבג"צ מהווה שיקול יתר משיקולים של פרטיות, בטחון ודמוקרטיה.

3.1.9 – תעודה חכמה כן, מאגר לא. למה לכרוך אותם ביחד?

3.2 – ליקוק אחוריים אחד גדול מצד רשות האוכלוסין או חוסר ענין במשמעויות הבעיתיות של ההחלטות שנפרסו פה.

שימו לב שאין פה שום נציגות של רמו"ט (הם קיבלו את סיכום הישיבה אחרי הישיבה), שום גוף עם אינטרס לשמירת פרטיות הציבור או לאזן את משחקי הכוחות של המשטרה לשליטה במאגר. לצערי אין סיבה שזה לא ימשיך ככה.

אינני יודע אם תאורגן הפגנה בקרוב, אני רק מקווה שההתנהלות הזו תשכנע אתכם לא להשתתף בפיילוט כשיתחיל לרוץ, ולהסביר לכל מי שתוכלו למה להמנע ממנו.

עדכון משרד התחבורה – עברה שנה

השבוע תמלא שנה מאז שהגשתי את הבקשה לפי חוק חופש המידע לממונה על חוק חופש המידע במשרד התחבורה, הגברת אפרת קילשטוק ((קילשטוק – השם המקורי בצ'כית של ארגון "שוברים שתיקה"?)).
לפני כשלושה שבועות שלחתי להם עוד תזכורת ועכשיו הגיעה התשובה הסופית: מטעמי אבטחת מידע הם לא ימסרו לי שום מידע נוסף. זהו. קצר. קולע, באיחור של שנה ואחרי תשלום של 93 ש"חים.

אבל במחשבה נוספת התגובה הזו אכן עונה בצורה מושלמת לכל אחת מהסעיפים בשאילתא שלי. אפילו לפחות חודרניות שבהן. תראו כמה טוב זה עובד:

מהם הצווים או התקנות שהביאו להקמתו ומגדירים את ניהולו של המאגר החדש?

מטעמי אבטחת מידע, לא ניתן להעביר מידע נוסף

מתי הוצאו הצווים ומתי התחיל היישום?

מטעמי אבטחת מידע, לא ניתן להעביר מידע נוסף

מה היא איכות התמונות הנשמרות ובאיזה פורמט?

מטעמי אבטחת מידע, לא ניתן להעביר מידע נוסף

מי הגופים/ספקים המופקדים על ניהול תשתית המידע והתקשורת מלבד צוות המשרד?

מטעמי אבטחת מידע, לא ניתן להעביר מידע נוסף

מהו הנוהל שהכין המשרד לטיפול במקרה של דליפת מידע?

מטעמי אבטחת מידע, לא ניתן להעביר מידע נוסף

אם אווכח שאני מודאג מהתנהלות המאגר, אוכל לבקש שתמונתי תוסר ממנו? אני מבין שבזה עלול להיות כרוך ויתור על רשיון הנהיגה שלי, אך ברצוני לוודא שאני לא אקריב אותו לחינם, ותמונתי אכן תוסר אם אבקש.

מטעמי אבטחת מידע, לא ניתן להעביר מידע נוסף

טוב שיש חוק חופש מידע. אם לא תשאל, איך תדע?

כמה מילים על הנתיב המהיר

בענין מעצבן אחר של משרד התחבורה, בלי קשר ישיר לסאגה המתמשכת שלי, השבוע נחנך "המסלול המהיר" בכביש 1 צפון, שמאפשר למגיעים מירושלים לעקוף את הפקקים ולהכנס מהר לתל אביב. הפרסומת ברדיו שלחה אותי לאתר משרד התחבורה, שמספר מידע מוזר מאוד.

שימו לב – בשביל להנות מהמסלול שנגנב (הפקק בכניסה לתל אביב מדרום עכשיו ארוך יותר) אתם צריכים לעלות על כביש אחד דרומה לגנות, אפשר לעלות עליו רק לפני שפירים ואי אפשר לרדת ממנו לפני לה-גווארדיה, המחיר של הנסיעה בו ×–×–×” בפראות בין 7 ש"×— ו-75 ש"×— (20 בממוצע, שזה הרבה יותר ממה שעולה כביש שש). אפשר לחנות בשפירים ולקחת שאטל חינם לאיפה שאפשר להגיע ברכבת (למשל עזריאלי והבורסה, אבל לא רמת ×”×—×™"ל). וכל ×–×” רק למנויים, משרד התבורה לא מציין כמה גבוה הקנס שישלם × ×”×’ ללא-מנוי שייסע על הכביש ×”×–×” – את ×–×” מצאתי באתר המסחרי של הנתיב. הכביש הוא חינם לרכבים עם ארבעה נוסעים אבל בשעות השפל גם שלושה מספיקים. מה הן שעות השפל? לא מצוין. אתם חשים בני מזל? בואו עם שני טרמפיסטים והטילו d10 לראות כמה תשלמו.

משרד התחבורה גם מספר שהפרויקט עלה 400 מליון ש"ח (בעיקר המחלף, החניון וקילומטרים של גדר פלדה, הכביש כבר היה סלול על חשבון משלם המיסים ונגזל ממנו). חבל שאת הכסף לא השקיעו בשיפור התח"צ. כיועץ שמתזז מגדרה לרמת החי"ל ולרעננה לא מעט, אין לי ממש אופציות רציניות של רכבת או אוטובוס שמאפשרות לי לוותר לגמרי על המכונית הפרטית (הלוואי), לא מסלול מהיר זה מה שיפתור לי את בעיות התחבורה.

עדכון/תיקון – אפשר להגיע לחניון השאטלים גם מ412 מזרח (מכיוון בית דגון). עדיין, מוזר.

מחשבות על בעיות ההפרטה

אני רואה דוגמאות בכל יום לדעות שנובעות מבורות או התעלמות מבעיות הקפיטליזם, שיטה בה רווחת האנשים אינה חלק ממגוון השיקולים (מלבד במחלקות השיווק, לעיתים רחוקות ולא בכל השווקים), אלא רווחים מיידיים בלבד. הנה רק דוגמא אחת מרבות. יוסי לוי הביא לינק לכתבה על מארק סמית', מתלהב רכבות (בצדק) ותועמלן עצמאי של הנושא. הוא כותב על השבתת המרחב האוירי של אירופה בשנה שעברה אחרי התפרצות הר הגעש באיסלנד:

הצטערתי לגלות שחלק מחברות הרכבות באירופה לא התגלו במיטבן דווקא בתקופת המשבר הזאת. בעוד שבמזרח אירופה הבינו את הבעיה, הוסיפו רכבות, חיברו קרונות שינה וביטלו תחנות מיותרות, במערב אירופה חלק מהחברות ניסו לגרוף רווחים, ביטלו את כל הכרטיסים הזולים והעלו מחירים.

אני לא אומר שחברות כלכליות פועלות רק נגד רוחת הנוסעים וחברות ממשלתיות עושות את ההפך. לא חשדות דוגמאות הפוכות כמובן. אני פושט מצר על כך שבגלל חוקי השוק, אופי האדם המנהל את החברה וחוסר הדרישה של הלקוח (בישראל ×–×” בולט) לרמת שירות נאותה, חברות תמיד יעדיפו לעשות כסף עכשיו על פני שיפור התדמית ובנית רווחים עתידיים. רכבת ישראל במיוחד טובה בחסכון. התשתיות מתפרקות ולכן צריך פתאום לאחר רכבות, לדלל קווים, לדחות התקנת חיישני חום ומערכות כיבוי אש, וכולי. אפשר למצוא עוד הרבה דוגמאות כאלו, אבל השורה התחתונה היא שאם בטיחות ונוחות הם מטרה, חברה פרטית לא תשים את ×–×” בראש רשימת העדיפויות. הייתי שמח אם היתה איזו הגדרת ביניים – חברה שאינה ממשלתית אבל שביצועיה לטובת מיסים והלוואות לא נמדדים ברווחים אלא ברווחת הציבור.

IDN ושרת הלינוקס שלכם

לא אוהב IDN, IDN זה מעצבן. ה-URL מכוער והקונפיגורציה גם כן.

התבקשתי לצרף לאתר אצלי על השרת דומיין בעברית, האתר היום הוא yaro.co.il ומהיום הוא גם צלמת.co.il. אם הכתובת הזו מכוערת בעיניכם, תתחילו לחשוב על איך לכתוב http://צלמת.co.il או http://www.צלמת.co.il ושזה יראה קריא, ובכל מקרה הדפדפן מיד יתרגם את זה ויגלוש אל http://xn--hebews.co.il/. באופן מעצבן, זה יראה לרוב יותר קריא כשזה בתוך פסקה משמאל לימין. אני אישית לא יודע למה שמישהו ירצה את זה. לקרוא עוד על הפוליטיקה ועניינים אחרים מאחורי הרישומים האלו, אני ממליץ על הפוסט הזה של שחר.

אני אניח בצד את הטיעונים לכך שאתר שמופיע בכמה שמות נראה לגוגל כתוכן מועתק ומאבד פוטנציאלית פייג'ראנק אלא אם תצרו לו sitemap שיתקן את הרושם הקלוקל, אני לא אכנס כאן לשאלות של URL שמכיל RTL באמצע, אני אגיד לכם רק איך טכנית פתרתי את הבעיה בקבצים.

מחרוזת אותיות בעברית איננה נכתבת ב-ASCII ולכן אין לה מקום בתשתיות הישנות. לרוב אנחנו כותבים עברית בקבצי טקסט ע"י קידוד ביוניקוד, ISO8859-8i או אחיו CP1255 aka Windows-1255. באיזה מאילו מקודדים שמות IDN? אף אחד מהם. אז איך יודעים לפי איזה קידוד לכתוב את שם הדומיין בקבצים של BIND ו־Apache? לא ממש מצאתי הסבר מניח את הדעת. היה ברור לי שאצטרך להשתמש בשם בסגנון xn--something אבל לא היה לי מושג מאיפה להשיג אותו, אז זה השלב הראשון. הנה מה שמצאתי:

  1. הקלידו פקודת whois עם שם הדומיין בעברית, עם קצת מזל יש לכם את הכלי המודרני והקידוד הנכון (אצלי LANG=en_US.UTF-8) ותקבלו חזרה מ-ISOC את הקידוד הנכון, יצא ש"צלמת" זה xn--hebews
  2. שגרו apt-get install idn, ותקבלו כלי CLI לתרגום המחרוזות המעצבנות האלו.
  3. חפשו בגוגל מתורגמן IDN, יש הרבה.

ניסיתי להכניס את המחרוזת בעברית יוניקוד לקבצי הקונפיג של BIND ישירות אבל זה פשוט לא הצליח. מצטער, חברים. חייבים להכניס שם IDN מתורגם, עד כמה שזה מכוער.

עצה – הדרך הנוחה לניהול דומיינים מרובים לאותו האתר תחת BIND הוא הפניית כמה דומיינים לאותו קובץ zone, אם כתבתם אותו נכון ללא שמות מלאים (למשל השמות בקובץ מתייחסים ל־www ולא לשם מלא כמו www.yaro.co.il. – עם הנקודה בסוף כמובן). אני מייצר את ×”-named.conf אוטומטית מרשימות שמות של דומיינים שמצביעים על קבצים עם שמות כמו הדומיינים, אז אני עושה דבר דומה עם symlinks ברמת קבצי ×”Ö¾zone במקום בקובץ הקונפיג אבל התוצאה ×–×”×”. אפשרות אחרת היא לעשות שימוש ברשומת DNAME, ולפתור כמה בעיות במכה, כולל אולי זרימת הדואל. לא ניסיתי.

בעיה בדביאן לני – כלי חיפוש השמות host לא תומך כנראה יוניקוד, ×›×™ לחפש whois עם מחרוזת בעברית הצלחתי, אבל לא host. עוד נקודה לרעת השיטה.

בשלב הבא צריך להוסיף את האתר גם באפאצ'י. גם כאן עברית יוניקוד בקבצי קונפיגורציה לא תעבוד ותאלצו להוסיף את כתובות ה-IDN המכוערות. לכן בקונפיגורציה של האתר הסטאנזה עכשיו נראית ככה:

ServerName yaro.co.il
ServerAlias www.yaro.co.il
ServerAlias xn--6dbfabcqvj1f4b.co.il
ServerAlias xn—-zhcpbrbbyge2cxcu.co.il
ServerAlias xn--hebews.co.il
ServerAlias www.xn--6dbfabcqvj1f4b.co.il
ServerAlias www.xn—-zhcpbrbbyge2cxcu.co.il
ServerAlias www.xn--hebews.co.il

(הערה, בזמן הפרסום, הדומיינים המוזכרים פה עוד לא מופנים אל השרת שלי אז הלינקים העבריים עוד לא עובדים, זה יקח עוד כיומיים)