IDN ושרת הלינוקס שלכם

לא אוהב IDN, IDN זה מעצבן. ה-URL מכוער והקונפיגורציה גם כן.

התבקשתי לצרף לאתר אצלי על השרת דומיין בעברית, האתר היום הוא yaro.co.il ומהיום הוא גם צלמת.co.il. אם הכתובת הזו מכוערת בעיניכם, תתחילו לחשוב על איך לכתוב http://צלמת.co.il או http://www.צלמת.co.il ושזה יראה קריא, ובכל מקרה הדפדפן מיד יתרגם את זה ויגלוש אל http://xn--hebews.co.il/. באופן מעצבן, זה יראה לרוב יותר קריא כשזה בתוך פסקה משמאל לימין. אני אישית לא יודע למה שמישהו ירצה את זה. לקרוא עוד על הפוליטיקה ועניינים אחרים מאחורי הרישומים האלו, אני ממליץ על הפוסט הזה של שחר.

אני אניח בצד את הטיעונים לכך שאתר שמופיע בכמה שמות נראה לגוגל כתוכן מועתק ומאבד פוטנציאלית פייג'ראנק אלא אם תצרו לו sitemap שיתקן את הרושם הקלוקל, אני לא אכנס כאן לשאלות של URL שמכיל RTL באמצע, אני אגיד לכם רק איך טכנית פתרתי את הבעיה בקבצים.

מחרוזת אותיות בעברית איננה נכתבת ב-ASCII ולכן אין לה מקום בתשתיות הישנות. לרוב אנחנו כותבים עברית בקבצי טקסט ע"י קידוד ביוניקוד, ISO8859-8i או אחיו CP1255 aka Windows-1255. באיזה מאילו מקודדים שמות IDN? אף אחד מהם. אז איך יודעים לפי איזה קידוד לכתוב את שם הדומיין בקבצים של BIND ו־Apache? לא ממש מצאתי הסבר מניח את הדעת. היה ברור לי שאצטרך להשתמש בשם בסגנון xn--something אבל לא היה לי מושג מאיפה להשיג אותו, אז זה השלב הראשון. הנה מה שמצאתי:

  1. הקלידו פקודת whois עם שם הדומיין בעברית, עם קצת מזל יש לכם את הכלי המודרני והקידוד הנכון (אצלי LANG=en_US.UTF-8) ותקבלו חזרה מ-ISOC את הקידוד הנכון, יצא ש"צלמת" זה xn--hebews
  2. שגרו apt-get install idn, ותקבלו כלי CLI לתרגום המחרוזות המעצבנות האלו.
  3. חפשו בגוגל מתורגמן IDN, יש הרבה.

ניסיתי להכניס את המחרוזת בעברית יוניקוד לקבצי הקונפיג של BIND ישירות אבל זה פשוט לא הצליח. מצטער, חברים. חייבים להכניס שם IDN מתורגם, עד כמה שזה מכוער.

עצה – הדרך הנוחה לניהול דומיינים מרובים לאותו האתר תחת BIND הוא הפניית כמה דומיינים לאותו קובץ zone, אם כתבתם אותו נכון ללא שמות מלאים (למשל השמות בקובץ מתייחסים ל־www ולא לשם מלא כמו www.yaro.co.il. – עם הנקודה בסוף כמובן). אני מייצר את ה-named.conf אוטומטית מרשימות שמות של דומיינים שמצביעים על קבצים עם שמות כמו הדומיינים, אז אני עושה דבר דומה עם symlinks ברמת קבצי ה־zone במקום בקובץ הקונפיג אבל התוצאה זהה. אפשרות אחרת היא לעשות שימוש ברשומת DNAME, ולפתור כמה בעיות במכה, כולל אולי זרימת הדואל. לא ניסיתי.

בעיה בדביאן לני – כלי חיפוש השמות host לא תומך כנראה יוניקוד, כי לחפש whois עם מחרוזת בעברית הצלחתי, אבל לא host. עוד נקודה לרעת השיטה.

בשלב הבא צריך להוסיף את האתר גם באפאצ'י. גם כאן עברית יוניקוד בקבצי קונפיגורציה לא תעבוד ותאלצו להוסיף את כתובות ה-IDN המכוערות. לכן בקונפיגורציה של האתר הסטאנזה עכשיו נראית ככה:

ServerName yaro.co.il
ServerAlias www.yaro.co.il
ServerAlias xn--6dbfabcqvj1f4b.co.il
ServerAlias xn—-zhcpbrbbyge2cxcu.co.il
ServerAlias xn--hebews.co.il
ServerAlias www.xn--6dbfabcqvj1f4b.co.il
ServerAlias www.xn—-zhcpbrbbyge2cxcu.co.il
ServerAlias www.xn--hebews.co.il

(הערה, בזמן הפרסום, הדומיינים המוזכרים פה עוד לא מופנים אל השרת שלי אז הלינקים העבריים עוד לא עובדים, זה יקח עוד כיומיים)

גוגל מספחת את ההיסטוריה

כתבתי פה פעם שמדינת ישראל עושה שגיאה חמורה כשהיא מתקמצנת על קיטלוג ודיגוט אוצרות לאומיים, כולל ארכיון צה"ל וארכיונים לאומיים אחרים. בראיון עם דב ויינר לקריקטור העלינו את הדאגה שכדי לחסוך כסף, ישראל תתן לגוגל את הכבוד לסרוק ולשמור בעלות על סריקות שראוי שיהיו ברשות הציבור.

(חלק שני מתוך ארבעה של הראיון, ההתייחסות מתחילה בסביבות 1:40)

אשר יגורנו בא לנו. גוגל מתעתדים להשקיע את הכסף הנדרש לסריקת מגילות מים המלח (לא ברור כמה מהן), ותאפשר לקרוא אותן פלוס תרגום דרך שרתי גוגל, אבל כנראה לא להוריד את חומר הגלם לעיבוד בדרכים אחרות (בכ"ז, צריך להגן על ההשקעה). מדינת ישראל למעשה מושכת ידיה מהאחריות לסריקה והטיפול בחומר, ומשאירים ליד הנעלמה (לא כל כך) של כוחות השוק להחליט בשליטת מי יהיה המידע שאמור להנתן גולמית לחוקרים, אבל ישאר כנראה בבעלותה של גוגל.

יום ארבעים ושתיים

לאחרון בתחתית החבית שעוד לא שם לב שהתאריך היום הוא 10.10.10, בוקר טוב. יש כמה חוכמולוגים שהחליטו להכריז היום על היום הבינארי, יש כאלו שהלכו צעד הלאה ובשימם לב לכך ש-101010 הוא 42 בבסיס הבינארי, הקדישו אותו לכל מה שדגלאס אדמס. או חוזר על עצמו 42 פעם, או קשור איכשהוא ל-42. אני חושב שלאדמס היה מסר קצת יותר עמוק מזה למין האנושי, אז אני לוקח את ההזדמנות וממליץ לכם פה על 42 דברים טובים למוח ולאנושות, אבל אני פותח, לצערי, בכמה דברים מטרידים.

  1. קחו יוזמה, כיתבו לחברי הכנסת שלכם הגד הדברים שמטרידים אתכם. למשל השבוע, בין שמחת תורה לגירוש ילדים, עסק אלי ישי בלגבש הצעת חוק שתגשים לו את חלומו לשלול מלא-יהודים את אזרחותם. בחדרים אפלים אחרים מתרגשת ובאה עלינו הצעת "חוק הטרור" הזדונית לא פחות. עוד מפחידים פה. יש שמועות על הפגנות בתל אביב היום, אבל הם פורסמו בדף נעול בפיסבוק אז אין לי פרטים (יופי, אדיוטים).
  2. לא פחות עצוב – היום עבר חוק הנאמנות של כהנא, רק בשם ליברמן.
  3. היום הוכרז גם כיום פעילויות של ארגון 350, גשו לאתר שלהם ותראו אם בא לכם להצטרף.
  4. מקורות מידע לספקנים שהבטחתי באייקון להביא:

  5. שפינוזה: האתר הראשי, שאלות ותשובות, פלאנטה (עם קישורים לבלוגים ספקנים נוספים)
  6. היום היום הראשון של השנה האקדמית. אם לא נרשמתם לכלום, אתם עדין יכולים לבהות בהרצאות מקוונות מעשרות אוניברסיטאות ומאות מכללות וללמוד דברים חדשים.
  7. בואו לערבי "ספקנים בפאב"
  8. בואו לשמוע את סיימון סינג בשבוע הבא
  9. …וקראו את הספר שלו.
  10. המלצות לפודקאסטים משפינוזה
  11. חפרו במילון הספקנות ועוד אתרים
  12. מדע אחר של רועי צזנה
  13. נסיכת המדעים של יוסי לוי
  14. מסה קריטית של יואב לנדסמן
  15. מדע וחיות אחרות של לוטם אליהו
  16. בן גולדאייקר, הבלוגר והסופר
  17. ספריו הנהדרים של פיינמן, הנה מבחר שתורגם לעברית, ועוד אחד.
  18. קרל סייגן: קוסמוס, עולם רדוף שדים, נקודת התכלת, בליונים ובליונים וכמובן סדרת הטלוויזיה.

  19. (גרסה מקוצרת מתורגמת לעברית)

  20. דאגלס אדמס – הזדמנות אחרונה לראות. למי שמעדיף ויזואלית, יש הרצאות שהוא נתן בנושא, ויש את סדרת הטלוויזיה החדשה של פרי.
  21. ג'יימס ראנדי: מספר ספרים מעניינים בנושא ספקנות, הידוע ביותר הוא "פלים פלאם!"
  22. מרטין גארדנר: Fads and Falacies in the name of science וגם The New Age: Notes of a Fringe Watcher.
  23. מייקל שרמר: Why People Believe Weird Things: Pseudoscience, Superstition, and Other Confusions of Our Time וספרים ספקנים אחרים.
  24. ניל דגראס טייסון: "תיק פלוטו" ואחרים.
  25. פיל פלייט: "אסטרונומיה גרועה". כדאי גם להכיר את הבלוג שלו.
  26. דן אריאלי: לא רציונאלי ולא במקרה.
  27. עוד ספרים בהמלצת עמותת הספקנים האמריקנית

  28. ספקנים מומלצים בטוויטר: פיל פלייט, ניל דגראס טייסון, מפצחי המיתוסים (ספציפית אדם סבאג' וגרנט אימהארה), מאסימו פיליוצ'י, רבקה ווטסון, בן גולדאייקר, סיימון סינג, ספק סביר, שפינוזה, יוסי לוי, סקפצ'יקס, ד"ר רחל "רייצ'י" דאנלופ, פרופסור בריאן קוקס, ריצ'ארד סונדרס, ה-JREF, , דארן בראון, ג'ניפר מק'קרייט, בריאן דאנינג, פ.ז. מאיירס, ד.ג. גרות'י, קרוליין פורקו, אלכסנדרה ג'ליקו, סופיה קולינס ואשלי פרמור .עדכון: איך שכחתי את ריצ'ארד וייסמן?!
  29. Reason Magazine
  30. פורה
  31. "פן וטלר: בולשיט". לא התכנית הכי ספקנית בעולם (הם מגיעים עם הרבה דעות קדומות ופוליטיות לעריכת הפרק), אבל מציגה את הצדדים הבעייתיים בהתנהגויות או דעות נפוצות בציבור. לא תמיד אני מסכים עם דעתם, אבל הם גרמו להרבה אנשים לחשוב מחדש על דברים.בתגובה לביקורות כאילו הם משתמשים בשפה גסה מדי או מפשטים מדי את הנושאים, הם שמחים להסכים, ופשוט לציין שבעוד שיש תכניות יותר רציניות, מדעיות ושקולות, זה לא הסגנון שלהם, והעובדה היא שהם מגיעים אל קהל נערי הקולג' השיכורים (ציטוט מפיהם!) בניגוד לדיסקאברי וערוץ ההיסטוריה.
  32. מפצחי המיתוסים: בערוץ דיסקאברי, מי שלא מכיר, תתביישו 🙂 מי שרוצה עוד קארי, יש לה תוכנית יומית חדשה. קארי ביירון אימפריה!
  33. ולבסוף כמה דברים אקראיים אחרים שאם לא הכרתם, כדאי לכם להכיר:

  34. מייקר בוט –>
  35. אקטיביזם ותוכנה חופשית של איתמר "הדבר הכי טוב שקרה לאינטרנט בעברית" שאלתיאל
  36. יצא אובונטו 10.10, אומרים שיצא 10.
  37. אקו-ויקי
  38. איידנטי.קה – החלופה החופשית לטוויטר (היחידה עד שדיאספורה תתחיל לפעול)
  39. "הנה זה בא" מאת פרופ' דני רבינוביץ'
  40. גיקים מעניינים לעקוב אחריהם בטוויטר: ויל ויטון, פלישיה דיי, ניל גיימן, טים מינצ'ין, איתמר שאלתיאל, דידי חנוך, תומר ליכטש, נמרוד קרת, קורי דוקטורוב.
  41. זמן ותודעה מאת אבשלום אליצור
  42. XKCD
  43. דונאלד דאק תחת השפעתו של גלן בק, רמיקס יוטיובי מתוחכם ומבריק. הנה תגובתו המבואסת וחסרת הביקורת העצמית של בק.
  44. The Money Fix – תעודה על מערכות מוניטריות חלופיות
  45. פריבייס זה כלי חזק ומעניין, ולאחרונה נקנה ע"י גוגל שממשיכה לפתח אותו כתוכנה חופשית.
  46. 6*9=42 אבל רק בבסיס 13.

מה מטריד אותי היום

ראשית, אני חייב התנצלות לבאי ההרצאה שלי באייקון, הבטחתי פוסט עם ספרים ואתרים מומלצים, אני אעלה אחד מחר אני מקווה.

שנית, ברוכים הבאים כל הקוראים החדשים. לפעמים יש לי גם פוסט חיובי, הפוסט הזה פחות. מתנצל. אבל כמו שאמרה לי קוראת חדשה אחת "אני קוראת אצלך כל פוסט ומתעצבנת מחדש, זה פשוט נפלא, מעצבנים אותך כל הדברים הנכונים!" (לא ציטוט מדויק, זה בערך מהזכרון).

אז כמה מהדברים מהמייל והטוויטר שכואבים לי השבוע בחדשות:

מצד שני, דברים ששימחו אותי:

להתראות בבוקר.

כרומהיר

כמה מהיר?

יותר ממהירות הקול. יותר אפילו ממהירות תפוח האדמה.

יותר מפאקינג מהירות הברק (באדיבות מחולל ואן דר גראף אחותי):

ולמרות זאת אני נשאר עם פויערפאקס, דפדפן כור מחצבתינו וסלע קיומינו לעולם ועד שיצא דפדפן פתוח יותר טוב.

גוגל שושו

כל מי שרצה לקרוא על ענת קם פשוט פתח תקשורת זרה. אבל גוגל מספרים שמדינת ישראל ביקשה (וקיבלה) חסימות נוספות. מרתק, לא?

עומר שאל אותי היום איפה מוצאים עוד על הפרשה ההיא עם ערביי ישראל והסיפור עם ה… טוב, בטח אסור לי להגיד כלום כי יש איזה צו פרסום. בגוגל ניוז אין כלום, אבל אולי זה בגלל שאני מגיע מכתובת IP ישראלית.

האם יש לנו צנזורשת ללא חוק?

לפני כמה שבועות שלח לי מישהו לינק למסמך שפעם היה בwikileaks, ובו מצוין שישראל אכן חוסמת:

Several foreign countries including China, Israel, North Korea, Russia, Vietnam, and Zimbabwe have denounced or blocked access to the Wikileaks.org Web site to prevent citizens or adversaries from accessing sensitive information, embarrassing information, or alleged propaganda. The governments of China, Israel, and Russia have asserted that they have a right to remove from the Internet protected government information, disinformation, and propaganda that is intended to embarrass or make false allegations against their governments. China, Israel, North Korea, and Russia are assessed to have state-sponsored CNE, computer network attack (CNA), and cyber forensics capabilities that would most likely allow penetration or disrupt viewing of the Wikileaks.org Web site. China, Israel, and Russia have used or are suspected of having used CNA to target terrorist or dissident Web sites that have posted objectionable material intended to embarrass, harm, or encourage terrorism or opposition to the government.

למישהו יש דיעה על הענין, או מידע שיסביר את זה, לכאן או לכאן?

הנה המסמך המקורי המלא, למי שחושב שויקיליקס לא פרנואידים (אני אישית עדיין מוצא את זה מפתיע שישראל מסננת, אבל לא שולל את זה לחלוטין…)
Us Intel Wikileaks

עדכון: צו איסור הפירסום הוסר. עוד פרטים כאן. בעעע ועוד בעעעעע.