अमेरिकेमधून प्रसिद्ध होणारे ‘टाईम’ हे मासिक त्याच्या दर्जाबाबत जितके प्रसिद्ध आहे तितकेच ते त्यात प्रसिद्ध होणाऱ्या ‘Person of the Year’ किंवा ‘Most Influential Person of the Year’ यासारख्या याद्यांमुळेही चर्चेत असते. प्रत्येक वर्षी हा बहुमान कोण मिळवणार याबद्दल जगभरात कुतूहल असते. काही दिवसांपुर्वी यावर्षीची ‘Most Influential Person of the Year’ यादी जेव्हा प्रसिद्ध झाली तेव्हा मात्र वाचकांचे डोळे आश्चर्याने विस्फारले गेले. यादीत 1 नंबरवर बराक ओबामा, दलाई लामा, पुतीन, ओप्रा विनफ्रे यासारख्या दिग्गजांना मागे टाकत ‘मुट’ या नावाच्या व्यक्तिने सर्वाधिक पसंतीची मते मिळवली होती. हा मुट ‘हा’ आहे की ‘ही’, काळा की गोरा, माणुस की वस्तू हेसुद्धा बहुतेकांना माहीत नव्हते. अशा परिस्थितीत सर्वाधिक लोकांनी त्याच्या पारड्यात आपले मत टाकणे म्हणजे आश्चर्याची परिसीमाच!
कोण हा मुट?
टाईमच्या स्लाईड्समध्ये या बाबाबद्दल ही अशी माहिती दिलेली आहे. पण प्रत्यक्षात निकाल हातात आल्यावर मात्र टाईमने थोडे कष्ट घेऊन बहुधा अधिक माहिती मिळवली आहे -
म्हणजे नोकरीसुद्धा नसलेल्या या 21 वर्षांच्या पोऱ्याने भल्याभल्यांना मागे टाकले!
पण खरी गंमत ही नव्हे. या ऑनलाईन वोटींगचे हॅकर्सनी (प्रचंड कष्ट घेऊन) तीन-तेरा कसे वाजवले हे वाचणे प्रचंड थ्रिलींग आहे.
टाईमचा पचका – फेज 1
टाईम मासिकाचे चुकले काय तर त्यांनी त्यांच्या ऑनलाईन वोटींगसाठी सुरुवातीला CAPTCHA वापरलाच नाही. मुटला जिंकवणे फार अवघड नाही हे मुटच्या स्वयंघोषित पाठीराख्यांच्या लक्षात आले. त्यांनी मग वोटींगची URL क्रॅक करून, त्या URL चे स्ट्रक्चर समजाऊन घेऊन काही URL तयार केल्या आणि इंटरनेटवर असंख्य ठिकाणी त्या पोस्ट केल्या. माहीत नसलेल्या एखाद्याने त्यावर क्लिक केले की प्रत्यक्षात मुटला रेटींग मिळायचे. उदा. तुम्ही http://अबकडश्रक्षत्र.com/gen.php?id=1883924&rating=100&amount=160 या लिंकवर क्लिक केले की नकळतपणे तुम्ही मुटला 160 वेळा 100 पैकी 100 रेटींग देऊन बसता! अशाच प्रकारची दुसरी लिंक वापरून तुम्ही बराक ओबामाला 500 वेळा 1 रेटींग द्याल आणि मग स्वाभाविकपणे त्यांचा यादीतला नंबर खाली जाणार मुटचा वर जाणार. याचा परिणाम झाला असा की मुटला 300 टक्के वगैरे रेटींग आणि प्रतिस्पर्ध्यांना मात्र अक्षरशः निगेटीव्ह रेटींग!
टाईमचा पचका – फेज 2
परंतु हे काळे-बेरे टाईमच्या वेळीच लक्षात आले. त्यांनी मग URL मध्ये एक गुप्त शब्द टाकला. वरीलप्रमाणे एखाद्याने लिंकवर क्लिक केले तरी आता ऑटोमॅटीक रेटींग होणार नव्हते. याशिवाय, एखाद्याला मिळणाऱ्या 2 रेटींगमध्ये किमान 13 सेकंदांचा गॅप असलाच पाहीजे अशी एक तरतुद टाईमच्या तंत्रज्ञांनी करून ठेवली. म्हणजे एखाद्या प्रोग्रॅमद्वारे 13 सेकंदात एकालाच दोनदा रेटींग झाले की तो आयपी अॅड्रेसच बॅन होणार.
प्रत्यक्षात याचा परिणाम उलटाच झाला. आतापर्यंत केवळ मजा म्हणून प्रयत्न करणारे हॅकर्स आता पेटून उठले. मुटला जिंकवून आणण्याचा त्यांनी आता विडाच उचलला. बरीच खटपट केल्यावर URL मधील गुप्त शब्द शोधण्याची क्लृप्ती त्यांना सापडली. टाईमने या वोटींगसाठी एक फ्लॅश अॅप्लीकेशन वापरले होते. त्यात हे शब्दराव लपले आहेत असे हॅकर्सना लक्षात आले. हा शब्द एकदा सापडला की मग पुन्हा त्यांचा URL स्पॅम अॅटॅक चालु! 13 सेकंदांच्या अटीचीदेखील त्यांनी अफलातून वाट लावली. 13 सेकंदात एकाला दोनदा नाही ना? ठिकाय…सेकंद नं. 1 – मुटला पॉझिटीव्ह वोट, सेकंद नं. 2 ते 13 – इतरांना निगेटीव्ह वोट!
आता या हॅकरांचे काय करावे?
टाईमने या पोलची विश्वासार्हता टिकवण्यासाठी एक शेवटची आणि जालीम चाल खेळली. यावर मात करणे खरोखरच अवघड होते. टाईमने reCAPTCHA वापरला – म्हणजे नो ऑटो वोटींग!
रिकॅपचा!
कुठलाही ऑनलाईन रजिस्ट्रेशन फॉर्म भरतांना किंवा ऑनलाईन वोटींग करतांना तुम्ही खालील कोड/ चित्र पाहिले असेल -
याला म्हणतात CAPTCHA. याचा लॉंगफॉर्म वाचला की याचा उद्देश्यही लक्षात येतो - “Completely Automated Public Turing test to tell Computers and Humans Apart.” ही अशी प्रचंड गिचमीड, वाचायला कर्मकठीण अक्षरे फक्त माणसेच वाचू शकतात. समजा मी असा एक कॉम्प्युटर प्रोग्रॅम तयार केला की जेणेकरून प्रत्यक्ष माणसाच्या ऐवजी तो प्रोग्रॅमच लाखो-करोडो लॉगीन-आयडी तयार करेल, लॉगीन करेल. यामुळे ती साईट अक्षरशः बसेल! हा स्पॅम अॅटॅक रोखण्यासाठी CAPTCHA चा जन्म झाला. ही गिचमीड अक्षरे आणि अंक (तेही एखाद्या टेक्श्चर्ड बॅकग्राऊंडवर) एखाद्या स्पॅम प्रोग्रॅमला वाचायला लावणे सध्यातरी जवळपास अशक्य आहे.
कॅपचा कळाला…आता हा रिकॅपचा कोण?
हा कॅपच्याचा मोठा, अधिक बुद्धिमान आणि आणि परोपकारी भाऊ. याच्या परोपकारातच याची बुद्धिमत्ता लपली आहे. वरील चित्रात, खालच्या उजव्या कोपऱ्यात काय लिहीले आहे?
‘stop spam. read books’
म्हणजे काय असावे.
जगभरात पुस्तकांच्या बाबतीत एक मोठा प्रोजेक्ट चालू आहे तो म्हणजे त्यांच्या डिजीटायझेशनचा. हस्तलिखीते, छापील पुस्तके इत्यादींना जसेच्या तसे इलेक्ट्रॉनीक स्वरुपात आणण्याचा हा प्रकल्प. हे डिजीटायझेशन साध्य करण्यासाठी OCR म्हणजे Optical Character Recognition स्कॅनर्स वापरली जातात. साध्या स्कॅनरमध्ये आणि यांच्यात फरक म्हणजे OCR एखाद्या लिखीतामधून शब्दाक्षरे तेवढी वेगळी काढतात आणि त्यांना डिजीटल फॉर्ममध्ये सेव्ह करतात. व्यक्तिपरत्वे हस्ताक्षरामध्ये असणारी भिन्नता किंवा दोन अक्षरांमध्ये असणारे साम्य (उदा. ट आणि ढ) यामुळे OCR 100% बरोबर असु शकत नाहीत. यावर उपाय म्हणून एक पुस्तक दोन वेगळ्या पद्धतीच्या OCR मधून स्कॅन केले जाते व चूक टाळायचा प्रयत्न केला जातो.
पण एखाद्या शब्दाबद्दल या दोहोंमध्ये मतभिन्नता आली तर? इथे येते ती reCAPTCHA ची परोपकारी वृत्ती.
OCR च्या मतभिन्नतेतून येणारा शब्द येतो reCAPTCHA मध्ये…आणि तुम्ही-आम्ही त्याचे करेक्शन करतो!
reCAPTCHA त दोन शब्द येतात. त्यातला एक हा दिक्षा घेतलेला असतो म्हणजे त्याच्या योग्य OCR रिडींगबद्दल खात्री झालेली असते. दुसरा बापुडा शब्द मात्र OCR च्या मतभिन्नतेत भरडला गेलेला असतो. समजा हा शब्द आहे ‘टकमक’. हा शब्द एखाद्या शंका नसलेल्या शब्दासोबत रिकॅपचामधून आपल्यासमोर येतो. ‘टकमक’ ला वाचून जास्तीत जास्त लोकांनी एंटर केलेला शब्द ग्राह्य मानला जातो. ‘टकमक’ वाचून एंटर केलेला शब्द ‘टकमक’चे ‘लेबल’ या पदावर जाऊन बसतो. एखाद्या शब्दासाठी एकच ‘लेबल’ पुन्हापुन्हा येत गेले म्हणजे त्या लेबलची बढती होऊन तो शब्द प्रमाणीत केला जातो. असा प्रमाणीत झालेला शब्द मग ज्या ज्या पुस्तकांमध्ये जिथे जिथे तो शब्द असेल तिथे जाऊन बसतो.
आहे की नाही ‘वॉट अॅन आयडीया, सरजी!’
टाईमचा पचका – फेज 3
रिकॅपचा लावल्याने झाले काय की हॅकर लोकांनी तयार केलेले URL ऑटोवोटर्स आता काहीच उपयोगाचे नव्हते. अशा URL वर झालेली प्रत्येक क्लिक रिकॅपचाच्या दारावर जाऊन अडकणार होती.
एकीकडे हा प्रश्न उभा राहीला तर दुसरीकडे टाईम आता केव्हाही विजेता घोषीत करेल अशी परिस्थिती होती. वेळ कमी होता. केवळ मॅन्युअल वोटींग करून भागणार नव्हते.
यावर एकच उपाय होता – रिकॅपचामधील कच्चा दुवा शोधणे.
आणि या हॅकर्सनी तो शोधलाही!
त्यांची स्ट्रॅटेजी अशी होती -
समजा एखाद्याने ‘टकमक’ ला ‘ढकमक’ असा शब्द एंटर केला की ‘टकमक’ला ‘ढकमक’ हे लेबल लागते. समजा लाखो लोकांनी आलेल्या कुठल्याही शब्दाला ‘ढकमक’ हेच लेबल लावले तर एक वेळ अशी येईल की कितीतरी शब्दांना ‘ढकमक’ हे लेबल आधीच लागलेले असेल. त्यावेळी रिकॅपचामध्ये कुठला शब्द आला आहे हे न बघताच मी ‘ढकमक’ टाकले की काम तमाम!
यातही वेळ वाचवायसाठी त्यांनी आणखी एक क्लृप्ती केली.
रिकॅपचामध्ये दोन शब्द असतात – एक दीक्षा घेतलेला आणि एक मतभिन्नतावाला. यात गोम अशी आहे की यात तुम्ही मतभिन्नतावाला शब्दच फक्त ओळखला तरी चालते. म्हणजे दोन शब्द ओळखून ते टाईप करायची गरजच नाही. पण कुठला शब्द दीक्षा घेतलेला आणि कुठला मतभिन्नतावाला आहे हे कसे कळायचे? याबाबत हॅकर्सनी निरिक्षणातून एक नियमावलीच तयार केली. त्यांनी अशा प्रकारे वोट करण्यासाठी एक अॅप्लीकेशनही तयार केले. यात तुम्ही फक्त रिकॅपचा एंटर केला की डायरेक्ट वोट व्हायची सोय होती. शिवाय एकावेळी एकऐवजी तीन रिकॅपचा लोड व्हायचे म्हणजे एका वेळेस तीन वोट मुटला!
यात मॅन्युअल कष्ट अधिक होते. पण तरी हॅकर्सनी आपला हेका न सोडता मुटला लाखो-करोडोंनी वोट मिळत राहतील याची काळजी घेतली.
यात सगळ्यात मजेशीर बाब म्हणजे टाईमने ऑफिशियली वोटींग बंद करुनही पुढचे दोन दिवस मुटसाठी वोटींग चालुच होते – कारण टाईमने वोटींग URL काही बंद केली नव्हती!
अॅण्ड दि विनर इज…
हे स्पॅमिंग लक्षात आल्याने टाईम निकाल घोषीत करेल की नाही याबाबत शंका होती. पण अखेरीस मुट हाच Most Influential Person of The Year आहे असे टाईमने घोषीत केले आणि एका मोठ्या हॅकींग प्रकल्पाची सांगता झाली.
यात विशेष म्हणजे हॅकींगचा हा प्रकार मान्य न करता ‘तुम्ही शंका घेणार माहीत होते आणि शंका-कुशंका वगैरे ऑनलाईन वोटींगचा एक भागच असतो’ अशी टाईमच्या संपादकांनी घेतलेली भुमिका.
काही असो – झाला हा प्रकार एखाद्या चित्रपटाला शोभेलसा आहे हे नक्की. खरे की नाही?
No related posts.


April 29th, 2009 at 3:52 pm
This is one of the best articles i have ever read on the net. Excellent work.. I am impressed.. Good job. keep it up..
April 29th, 2009 at 4:06 pm
sahee.. masta mahiti dili ahe. hya prakara baddal adhi kuthech vachale navhate.
April 30th, 2009 at 5:45 am
Really nice and informative article. I was amused to read this.
April 30th, 2009 at 7:10 am
झकास !!
मस्त आचट आणि भन्नाट आहे..
सही डोके लावले हैकर लोकांनी
हॉलीवुड मधे एकदा पिक्चर निघेल या विषयावर …
May 5th, 2009 at 7:44 am
@Mahendra: Glad that I have impressed you! Thanx for encouragement;
@ckt: Yes, I was also surprised to see that this hacking incident did not make news…anyway, now it has. Thanx for commenting.
@Devidas: Thanx Devidas. Keep visiting & sharing.
@Sak: या प्रकाराबद्दल वाचल्यावर माझी प्रतिक्रिया एक्झॅटली हीच होती. छान पिक्चर होईल नाही!
Cheers!