עיתונות לוחמת – בשכל הישר שלנו!

שימו לב לכותרת הידיעה הזו בידיעות: "ניסה להתחזות ונתפס בעזרת מאגר תמונות"

אבל בתוך הכתבה באותיות בפונט רגיל: "כשניסה להתחזות שוב, אותר על ידי אחד העובדים שזיהה את תמונתו מהקלסתרון שנתלה במשרד – והלמס נעצר."

לכל המתלהמים בתגובות – מאגר פושעים איננו מאגר חפים מפשע. הזדהות חזקה מול המדינה אינה בהכרח ביומטרית, ובישראל אין לנו את הבעיה של חוסר ת"ז או איזורי שיפוט שונים שלא משתפים פעולה כמו 50 מדינות עם משרדי רישוי נפרדים. הכותרת הזו בYNET מטעה ומגמתית לטעמי (ניב, אתה אישרת את זה?).

עדי שמיר עונה למבקרים

WTF?!

רומן בריק כרגע שלח לי לינק לתשובה של עדי שמיר באייטם YNET.

ומה התשובה לביקורות שנזרקו מצידי ומצד המגיבים לאייטם המקורי? אין בעיה, פשוט צריך יותר אנתרופיה… בואו נזרוק פנימה למאגר משרד הפנים גם את כל הפלסטינים ממאגרי הממשל הצבאי של השטחים הכבושים ואת התיירים מהמאגר של משרד החוץ, שלוש כפיות סוכר, קרח לפי הטעם, ונלחץ על liquify. ככה אם דולף המאגר יש לנו הרבה יותר אחים לצרה, ואף אחד לא ידע אם הוא הגריל טביעות אצבע של ישראלי או עובד זר או את בת הדודה שלי מווסטצ'סטר.

שוב יש לנו כאן תשובה יפהפיה מבחינה מדעית, אבל אין לי מושג איך זה ישים בעולם האמיתי. הנה מה שעולה לי בראש בלי להקדיש לזה יותר מדי זמן עיבוד: המאגר הוא דינאמי. כל הזמן נכנסים אליו עוד אנשים. לפזר אותם מחדש ביותר קבוצות לא נוכל כי לא שמרנו (לפי ההגדרה!) על קשר 1:1.

שמיר דיבר על קבוצות עמימות של 100 איש, הלא כן? אז מדי פעם צריך לפתוח קבוצות חדשות, או שמא מוסיפים לקיימות? כיון שהעמימות אמורה להגן עלינו רק נגד דליפת המאגר המרכזי, בואו נשקול את החלופות:

1. אנחנו מגדילים את הקבוצות הקיימות (ואיתן את העמימות):
החסרון לזיהוי – העמימות עולה.
היתרון לפרטיות – העמימות עולה.
החסרון אם המאגר דולף יותר מפעם אחת (נהיה ריאליסטיים) – מגלים מה הדלתא וכל מי שנוסף למאגר בין הגרסאות הוא בזיהוי מאוד מאוד לא עמום.

2. פותחים קבוצה חדשה כל 100 איש:
היתרון לפרטיות – הקבוצות מתמלאות מהר, אז קשה לגלות זהות לפי דלתא.
החסרון לפרטיות – אפשר לזהות לפי תאריכי לידה או תאריך כניסה ראשון לארץ. אפשר להבדיל בין טביעות אצבעות צעירות (ילדים) לבין מבוגרות (תיירים) וכך קבוצת ההתאמה קטנה.
עוד חסרון לפרטיות – בתקופות של תיירות רדודה, כל חברי הקבוצה החדשה הם ישראלים שנולדו בתאריך דומה, זה מזהה אותם בוודאות גבוהה כישראלים ונותן עוד נתון מידע על גיל.

3. פותחים הרבה קבוצות כדי שיקח שנה למלא 100 איש בקצב המאגר הרגיל:
החסרון לזיהוי – הקבוצות קטנות ולא עמומות למשך לא מעט זמן, דליפות מרובות יסגירו שוב המון מידע דרך מציאת דלתא.

אני יכול לפתח הלאה את הרעיון ולחפש בעיות אחרות:

* יש אנשים שמאוד לא ירצו שידעו שהם אי פעם ביקרו בארץ, כגון אזרחי מדינות מוסלמיות שאנו מאשרים להם לבוא לביקור דתי או עסקי אבל לבקשתם לא מחתימים את דרכונם.

* מאגר יותר גדול מכריח דגימת יותר אצבעות (למאגר של 7 מליון איש מומלץ לדגום 3-4 אצבעות מכל אדם לפי נאום המכירות של מנכ"ל OTI, אני מניח שעכשיו נצטרך לתת פעמיים אצבע משולשת).

* מכת המחץ ניתנת כמתנה בטיעון של פרופסור שמיר: "כאשר רשימת כמאה הזהויות האפשריות שלהם תתקבל בעקבות צו בית משפט, ניתן יהיה להצליב אותן עם המאגרים הרגילים של משרד הפנים כדי לנפות מהן את כל התיירים שידוע כבר שעזבו כבר את הארץ, או את כל האנשים שנפטרו ונקברו לפני זמן רב. ותשובתי – אם המאגר דולף, גם אני יכול לעשות את זה בעזרת האגרון שאוריד מאימיול, והנה הלכה העמימות.

בקיצור דעתי באותו המקום – אין לרעיון הזה מקום מחוץ למשחקי שעורי בית אקדמיים. זה לא פתרון נכון לפרטיות של אנשים אמיתיים.

עדכון – דורון מוסיף:

זה בדיוק משחק לידיים שלנו.
למעשה במעשיו הוא מחזק את הטענות שפתרון של מאגר יהיה פאטץ' על פאטץ'…
הוא בא לפתור בעיה מסויימת, ועכשיו הוא פותר אחרת שבאיזשהו מקום נולדה מהפתרון הראשון, או בגלל שהפתרון הראשון לא טיפל בה.

חייבים לעצור את המאגר!

הלך על מז"פ

שני פוסטים אחורה הפנ(ת)ה אותי הקורא(ת) הנאמנ(ה) זמ"מ למאמר מדעי של ד"ר דן פרומקין על אימות פורנסי של דגימות DNA. במאמר בNYT הוא מספר למעשה כמה קל לכל סטודנט לתואר ראשון בביולוגיה לפברק דגימת רוק או דם שלי עם הרוק והדם שלו, אם יש לו את ה-DNA שלי ממאגר כלשהוא (למשל זה שמשטרת ישראל אוספת כבר כמה שנים). מדען מNIST מגיב בכתבה שזה מאוד מרשים אבל הוא "לא חושב שהפושע הממוצע יטרח ללמוד וליישם את השיטות האלו". הזמן יגיד. אם הפשע ישתלם, אנשים ישקיעו בציוד.

המאמר מציע גם שיטה לזיהוי אם חתימת הDNA זויפה או שמדובר בDNA אורגני, אבל מעבר לכך לא מגלה בעצם דבר חדש. זה לא מבטל את הDNA כראיה אבל זה מאוד מחליש אותה, ויאלץ את מז"פ לעבוד יותר קשה. הבעיה העיקרית היא, שהשיטה של "הגברת DNA" שמשמשת כאן מזייף פוטנציאלי היא לרוב אותה השיטה בדיוק שמשמשת את מז"פ כדי להגביר דגימה לצורך בדיקתה.

הפרטים בוודאי ידועים לשלטונות החוק, אבל זה אומר שאיפשהוא מישהוא עובד על שיטות לעבוד גם על הבדיקה הזו. בקצב התקדמות שוק הביוטכנולוגיה, אני בטוח שהלוחמה הזו תהפוך ליותר יצירתית מהר מאוד, והמרוויחים יהיו כמובן יורשיו של מייקל קרייטון, אולפני הוליווד, ופושעים עשירים שונים. בלייד ראנר, מישהו?

סלאשדוט התייחסו לעניין, כמובן והתגובות לא אחרו להגיע…

מגיב א': דפיקה רצינית. (דורג "5, אבחנה חשובה")
מגיב ב': רק תזהר לא להשאיר עדות DNA מפלילה…

עדכון: חפירה גוגלאית מהירה מראה שזה סיפור מהתחלת השנה, הנה ב"הארץ".

עדכון שני: יכולתי להשבע שהכתבה היתה עם תאריך 01/01/2009 קודם, עכשיו אני רואה שהיא מלפני פחות מיום. באג? כנראה, כי הצצה נוספת בכותרת שלה מיד מזה אותה כתרגום של זו מהטיימז. מוזר מאוד.

מידע ששוחרר ולא יוחזר – רשימה קטנה לסיבור האוזן

זוכרים איך נעצר המאגר בגרמניה? האקרים פרסמו את טביעת האצבע של השר הממונה באינטרנט אחרי שהיא נלקחה מאיזו כוס או בקבוק. אולי בקבוק בירה גרמנית טובה ואולי סתם בקבוק מים מינרליים, אי אפשר לדעת…
בפחות מאלף מילים, אייבי נתן אומר: שתו רק מים!