מידע – עמוד 38 – אסכולת הכורסא

9 בינואר 2008

מתי ספאמפילטר תגובות מגוגל?

כמו כל וורדפרסאי עצמוני אני לא מעיז להקים מערכת בלי אקיסמט. למעשה הוא כ"כ מוצלח שהפכו אותו לחלק מובנה מהמערכת בגרסאות האחרונות. רק על באג אחד עוד לא התגברו – קשה לצאת מחיבוק הדוב שלו אם הוא פיתח טעם לאחד מהחברים שלך. חברי הטוב מישל נאכל כבר 6 פעמים החודש וכל פעם מצאתי אותו במקרה במעבר השבועי על תיבת הספאם של גברת וורדפרס וחילצתי אותו ממלתעות ה/dev/null

מישל שאל למה אני לא משתמש בגוגל, והתשובה הפשוטה היא שכאן מדובר בסט חוקים נפרד לגמרי, ושאינו מקביל לגמרי לספאם שבאימייל. הניסוחים שונים, מדובר בחוקים הרבה יותר פשוטים של ספירת כמות ואיכות הלינקים, ולשמחתי יש לרוב חזרה כל כך נרחבת על דוגמאות שזה מאוד קל. ספאמרים של תגובות בבלוגים בימינו עובדים ברמה שספאמרים של מייל עבדו באזור 2001, מאוד קלים לפילטור יחסית מהיר ומאוד אמין. מה גם שעוד לא כתבו פלאגין שיעשה את זה ואני אישית עצלן 🙂

אבל אני בהחלט רואה את זה קורה כשיפרץ הסכר וספאמרים יתחילו להפגיז את הבלוגים באמת. גוגל ממילא שמחה שכל בעל בלוג רושם את עצמו אצלם דרך פידברנר וגוגל סייטמאפס, מה אכפת לי בעצם אם כל הודעה ציבורית בבלוג תפולטר על ידם? אני בטוח שיום אחד זה עוד יקרה. בשבילם זה מכרה זהב! הרי מדובר בחברה שעושה כסף טוב מסטטיסטיקה על טקסט בשפה אנושית, וסטטיסטיקות כאלו הן יעילות יותר לפי איכות הדגימות. לא תמיד יש למנגנונים של גוגל מידע טוב על סוג הטקסט שהם דוגמים. הם יכולים בוודאי לנחש כבר די טוב אם טקסט שנתקלים בו הוא מדעי או ספרותי או עיתונאי, אבל מה אם הם עולים על זבל או חומר פרסומי?

גם אם אחוז מסוים מהבלוגים מכילים פוסטים פרסומיים, רובם המוחלט הוא יצירה אישית, והתגובות הן בשפה אולי לא מושלמת תמיד אבל בהחלט משפטים אנושיים וקשורים לנושא. משוב ממפעיל בלוג שישלוף שגיאות מיון מהזבל ויזרוק אחרות לשם שווה יותר ממה שאנשים כבר עושים היום בג'ימייל מכמה סיבות –
1. מדובר בטקסט בלבד, בלי קבצים מצורפים.
2. כל הטקסט בנושאים קרובים, מגיבים קבועים ישתמשו אולי בשפה בסגנון דומה, כמו כותבים קבועים של פוסטים.
3. הפוסטים הם ציבוריים בניגוד לתוכן התיבה בג'ימייל, אז מותר לעשות עליהם הרבה יותר בדיקות מבחינה אתית

אני רוצה שגוגל תציע לי את השירות הזה. בתמורה אני מצפה לסטטיסטיקות על כמה הפוסטים שלי אינטיליגנטיים או שטוטיים, עשירים או דלים בשפה, חיוביים או שליליים, וכך גם על קהל הקוראים שלי – אדיוטים או גאוני הדור?

אכן רבותי, ווב 3.0 לא ימדוד את האתר שלכם בפייג'ראנק ובאיזה מקום אתם מופיעים בחיפוש. הוא ימדוד אתכם בראנקינג אישי ובאיזה מקום אתם חברתית ואינטיליגנטית מבחינת הבעה. רע או טוב? הזמן יגיד. העתיד רבותי, הוא ספאם פילטר שיסנן לא רק פרסומות אלא גם אנשים מעיקים. חלום למיזנתרופים וחסרי הסבלנות. יום אחד יהיה פילטר אנשים כזה להשתלה במוח, אתם עוד תראו… אפשר יהיה פשוט לחסום משדה הראיה והשמיעה אנשים שהפילטר יחליט שכנראה יביאו לכם את הסעיף ויחסוך לכם מלפגוש אותם בכלל… טוב עכשיו המוח שלי נדד רחוק. אני חוזר לעבודה.

16 בדצמבר 200716 בדצמבר 2007

מעניין מה מטריד את Wired…

בגוגלבלוג מספרים לנו על יוזמה של גוגל לעודד אנשים לכתוב על נושאים שמעניינים אותם.

"רגע, זה לא הבלוגוספירה?"

לא… הם מעודדים אותם לכתוב מאמרים על נושאים מקצועיים, כמו ערכי אנציקלופדיה, והיוזרים יתנו להם ציונים ופידבק והצעות עריכה, ויהיו לינקים בין המאמרים.

"נו בסדר… אז זה כמו ויקיפדיה, נו מה?"

לא, נו! אבל הם מעודדים את הכותבים לשים שם את התמונה שלהם בשביל האגו ולשים פרסומות אדסנס ולהרוויח מזה כסף!

"טוב, אז זה כמו about.com… אז מה?"

נו אתה לא מבין? הם רוצים להשתלט לנו על הפייג'ראנק עם דפי מידע! הם מקנאים בדירוג הגבוה של הויקיפדיה! הם רוצים לדחוף את הפרסומות שלהם בכל מקום! זה יהיה מכת מוות לויקיפדיה!! אתה לא מבין שהיום הם שולטים על הקליק הראשון (דף הבית של החיפוש), הקליק השני (התוצאות וסדרן) ועכשיו הם רוצים להשתלט על הקליק השלישי!! תוכן התוצאות! ויהיו שם פרסומות אדסנס!

"א. חה
ב. חחה
ג. פחחחחח!

"אם גוגל יהנדסו את הפייג'ראנק הם יאבדו את אמון הקהל. גם אם הם יוסיפו את התוצאות למעלה למעלה, איך זה שונה מתוצאות שאני מקבל היום בראש הרשימה מיוטיוב או גוגל וידאו או פרוגל או גוגל ניוז וכולי? ואיך זה בדיוק יהיה תחרות לויקיפדיה?

"זו תחרות לabout.com ולא לויקיפדיה, אנשים עדיין יעדיפו את הויקיפדיה להרבה מהדברים (איפה עוד תמצא אתר עם ערכים לפרקים של סימפסונס ולשחקניות פורנו ולמשחקים של אטארי 2600 בכפיפה אחת, ולידם טענה כי יש להם בקלות יותר מאמרים מאשר לבריטניקה?). חוצמזה, גוגל לא מארחים את השרתים של ויקיפדיה אצלם בחווה? אני חושב שקראתי על זה פעם משהו…"

(שיחה וירטואלית זו לא נערכה ביני לבין וויירד באמת. זה קרה אצלי בראש. מוזר לי שהם נלחצים מזה שגוגל רוצים להוסיף תוכן לרשת)

מה כן מפריע לי? מפריע שלגוגל יש זמן לפתח מנגנוני תוכנה יפים וגדולים אבל לא עוצרים לרגע כשהם מוסיפים לי את זרם הShared items ברידר בלי אפשרות לחסום (ראו פוסט מאתמול), או לדאוג שיהיה לי מנגנון לכתוב מימין לשמאל בג'מיל (יש פלאג-אין וגם סקריפט גריזמונקי אבל שניהם הפסיקו לעבוד לפני חודש בג'מיל החדש, ולדעתי זו לא צריכה להיות אחריות של האקרים לתקן את מה שגוגל עושים בחצי-שעה של עבודת תוכניתן.)

אבל רוצים משהו מצחיק/טעים לסיכום? גוגל פרסמו דף דוגמא ל"נול" כזה, מאמר מהגוגלפדיה. "תראו כמה יפה זוהר האגו של הכותב בראש המאמר בואו לכתוב אצלנו, תרוויחו כסף!". שני פרטים מעניינים: את הנול כתבה רחל מנבר, והוא מחובר לפוסט שכתב אודי מנבר (נפוטיזם! בגוגל! אוי!), אבל יותר מענין שהעמוד, עם פרסומות האדסנס שבו מכיל תמונה שמוכרזת CC-nc.

תורכם להגיב 🙂

21 באוקטובר 2007

Remember, Remember, the 5th of November…

גוגל מתכוונת לתת פייט לפייסבוק ולהפעיל את כל תותחי כריית המידע שיש לה כדי לתת API וגישות לכל המידע המצליב שניתן למצוא באורקוט, ג'מיל, iגוגל ועוד בהמשך, הכל כדי למפות גראפים חברתיים יותר נרחבים ומושכים ממה שיש לאחרים להציע (וכרגע פייסבוק הוא הפיל הכי גדול בחדר לפי מה ששמעתי השבוע). האם אנחנו באמת רוצים את כל המידע וההקשרים הללו זמינים לנו? כמובן. מה אנחנו מפסידים אבל בדרך? האם, כמו שמנסח את זה קורי דוקטורוב, אנו עלולים להיות "Scroogled" באיזה יום מן הימים? האם יש לנו מה להתחיל לפחד או להתחיל להסיר משרתי גוגל מידע? המפף.

26 באוגוסט 200726 באוגוסט 2007

תמיד יש פוץ (על טכנולוגיה ומוסר)

איזה אחד צלם פרסם תגובה (אל תטרחו אפילו לצפות) לסרון שמדגים טריק עיבוד תמונה חביב שפירסמו שני ישראלים ביוטיוב:

האלגוריתם חביב וחכם, ולחלק מהפיצ'רים שלו דורש פורמט תמונה מורחב שכולל מידע מטא וכל מיני, ובכללי ברור כי אינו מופעל היום על אף דפדפן ומצוין שאינו מיועד לכל תמונה.

בא אותו המגיב וטוען בלהט שהוא "נפגע אישית" מהאלגוריתם החביב וחסר הכוונות המוסריות. האלגוריתם בא להשחית לו את התמונות ולדפוק לו את הקומפוזיציות! האלגוריתם פוגע לו בציפור הנפש!

לכל מי ששכל בקודקוד ברור שזו פונקציה של הדפדפן, והיוזר יכול יהיה לקבוע לעצמו אם להפעיל או להפסיק את הפיצ'ר, על אפו וחמתו של מציג התמונות, גם אם יהיה מטא-דטה כלשהוא בקובץ או בקוד העמוד שירמזו כי אפקט הRETARGET אינו רצוי, אין מי שחייב יהיה לציית לכך אם לא בא לו. זו החלטה של היוזר איך לראות את הדף, ויוכיחו ADBLOCKER, גריזמונקי וחברים.

27 ביולי 2007

אינטל ומדד הקוליות

אניטל התחילה סופסוף למכור BMC לתחנות עבודה. מדובר בכרטיס שפעם היה נמכר במאות דולרים לשרת אבל עכשיו בייצור המוני אפשר להכריז עליו כהגיוני גם לתחנות – איש תחזוקת הרשת יכול להתחבר למכונה מרחוק ישירות דרך החומרה, לשלוט במסך, מקלדת, עכבר וכפתור הכיבוי בלי להגיע לשולחן המשתמש, התחנה אפילו לא צריכה להיות דלוקה ומערכת ההפעלה יכולה אפילו להיות בתקלה שלא מאפשרת לה לצאת לרשת, אבל הכרטיס עוקף את כל אלו. בגלגול הדסקטופי של המוצר אינטל גם נותנים פיירוול חומרה קטן (נדמה לי, הטקסטים שלהם נוראיים ושיווקיים, אין מידע תכלס) כדי להפריד תחנות שחטפו וירוס לפני שידביקו את השכנים. בקיצור יותר שליטה ריכוזית לצוות הIT.

האחרונים שהיו קוליים בהפקות משרדיות (אני חושב) היו מיקרוסופט בריטניה ששכרו את ריקי ג'רבייז לעשות להם זוג פרקים של "יעוץ" סטייל "המשרד". מאז אין פיפס של מגניבות בתחום, אפילו שאינטל שכרו את קריסטופר גסט לביים שני קליפים (הוא ידוע גם כזמר של ספיינל טאפ והרוזן רוגאן בעל שש האצבעות) – עדיין זה נסיון עלוב. למה אין לחברות האלו חוש למגניבות? הם שוכרים חברות שיווק מרובעות מדי?

16 ביולי 200717 ביולי 2007

האיזון העדין בין נוחיות, פרטיות ובטיחות מידע

מערכת הדואל של האוניברסיטה העברית עוברת לג'מיל. כך בהודעת דוברת המוסד וכך כבר עודכן גם בדפי במידע שלו. זה נשמע לי מוזר שמוסד כזה מגלגל החוצה את השירות הבסיסי הזה. אבל לא שמעתי את זה בעיתונים, זה יצא בשקט בשקט רק לסטודנטים של האוניברסיטה ועובדיה הזוטרים (נראה שהדואר של של המרצים והעובדים הקבועים נשאר במערכת הישנה). הרבה קללות כבר נכתבו על המערכת הישנה של HUJI, אבל לפחות המערכת נשארה בתחומי המוסד עד היום. מדובר להעביר 24K תיבות החוצה לג'מיל כבר עוד כשבועיים, ועוד 100K תיבות של בוגרי המוסד בהמשך.

למי זה מפריע? ידידי מ' לומד אבל גם עובד במוסד. מפריע לו ובצדק שמידע פיננסי אישי שלו (משכורת, תגמולים שונים ומלגות) יעבור דרך מנגנוני הניתוח והארכיון של גוגל. אבל האוניברסיטה לא נותנת את האופציה לקבל את המידע האישי הזה בכתובת אחרת, ולמעשה מכריחה אותו לעבור להשתמש בשירותיו של הענק ממאונטיין-וויו בלי יכולת התנגדות או בחירה.

אני מניח שדברים דומים קורים בעוד חברות וארגונים. HUJI גם איננה הראשונה שהעבירה את כל הסטודנטים במכה אחת לג'מיל. למישהו יש מושג מה מצבו של ידידי מבחינת החוק? האם האוניברסיטה אכן יכולה לכפות עליו את קבלת המידע הפיננסי הנ"ל רק דרך המנגנון של גוגל?

עדכון: לינק ששכחתי להוסיף – גוגל בעלת הציון הגרוע ביותר בשמירה על הפרטיות לפי מחקר של "פרייבסי אינטרנשיונל". לא קראתי לפרטי פרטים ואין לי מושג מדויק מי מאחורי הבדיקה אבל זה עשה הרבה רעש לפני חודש וחצי.