reCAPTCHA – o aplicatie captcha desteapta
14Una din problemele principale cu care se confrunta orice comunitate (blog, forum, retea sociala, website etc) este spamul. Degeaba platforma este securizata, degeaba totul e aranjat daca apar comentarii date de roboti. Aceasta problema este un fenomen devenit clasic in lumea bloggerilor, existand diverse solutii pentru a combate aceasta problema.
Una din vechile metode de protejare a sistemelor de inregistrare, de autentificare, de comentare etc. il reprezinta aplicatiile Captcha.
Ce este o aplicatie Captcha?
Captcha (sau Completely Automated Public Turing test to tell Computers and Humans Apart) reprezinta un sistem ce urmareste identificarea robotilor si a oamenilor. Utilizatorul este nevoit sa rezolve un mic test ce implica doua parti : clientul (utilizatorul) ce este nevoit sa trimita rezolvarea la test si serverul – cel care trimite problema si asteapta raspunsul, urmand returnarea starii testului (este valid sau nu). Una din cele mai populare tehnici intalnite in sistemele captcha este oferirea testului sub forma de un mesaj intr-o imagine. Acel text este mascat cu diverse linii, culori etc. pentru a ingreuna crearea unui robot ce „citeste” acele imagini. Una dintre cele mai populare si mai eficiente aplicatii de acest gen este reCaptcha.
Ce este reCaptcha?
reCaptcha este un serviciu gratuit de captcha ce are un scop dublu : reducerea spamului pe diverse platforme si digitalizarea cartilor, revistelor vechi etc. Ati auzit bine, reCaptcha digitalizeaza aproape orice revista, carte ajutand la dezvoltarea bazei de date informationala ce este stocata online.
In fiecare zi 200 de milioane de captcha-uri sunt rezolvate de oameni in fiecare zi. In fiecare caz sunt pierdute aproape 10 secunde pentru a rezolva un singur test de acest gen. Individual, acest timp nu este mare dar adunand toate aceste secunde rezulta aproape 150,000 de ore de lucru in fiecare zi. Ce ar fi daca acest efort s-ar cumula intr-un front comun si urmarind scopuri pozitive? reCaptcha chiar face asta : ajuta la dezvoltarea „cunostintelor” ce le are internetul, digitalizand cartile.
Cum functioneaza reCaptcha pentru a digitaliza cartile?
Pentru a arhiva cunostintele umane si a le face mai accesibile lumii, exista multiple proiecte care urmaresc digitalizarea cartilor fizice ce au fost scrise in antichitate. Toate cartile sunt salvate fotografic si transformate ulterior folosind algoritmi OCR (Optical Character Recognition). Transformarea in text a cartilor scanate este un pas necesar, economisindu-se foarte mult spatiu virtual pentru stocarea cartilor. Problema este ca algoritmii OCR, oricat de performanti ar fi nu au eficienta 100%.
reCaptcha imbunatateste acest proces al digitalizarii, trimitand cuvintele ce nu sunt intelese utilizatorilor de pe web. Mai exact, orice cuvant ce nu este inteles corect de OCR este plasat intr-o imagine ce este folosita de sistemul captcha. Fiecare cuvant ce nu este cunoscut este trimis utilizatorului impreuna cu un alt cuvant ce este stiut. Utilizatorul este nevoit sa completeze ambele cuvinte. reCaptcha considera ca daca unul din cuvinte este scris corect, inseamna ca au de-a face cu un om si nu cu un robot. Acest proces este dat mai multor persoane pentru a vedea daca raspunsul este corect, devenind in scurt timp unul din cuvintele ce vor fi trimise ca fiind bune pentru a rezolva si mai mult din puzzle. Stiu, pare incredibil, dar reCaptcha are o eficienta de 99,5% in detectarea cuvintelor noi, fiind folosita de peste 100,000 de website-uri printre care si Facebook, Ticketmaster etc.
Securitatea reCaptcha
Dezvoltatorii reCaptcha se lauda cu cele mai ridicate standarde de securitate in 4 pasi. Diagrama de mai jos vorbeste de la sine. Pe langa acesti pasi, exista avantajul ca in momentul in care o aplicatie este capabila sa sparga captcha-urile generate de reCaptcha, acestea au posibilitatea de a distorsiona si mai tare imaginile, fara a fi necesara interventia celui care foloseste aplicatia. Un alt sistem de securitate il reprezinta inregistrarea adreselor IP. Daca un IP efectueaza foarte multe incercari de completare a unor formulare reCaptcha intr-un timp foarte scurt, respectiva adresa este marcata pentru o analiza ulterioara.
Instaleaza reCaptcha pe website-ul tau
Personal am fost atras foarte mult de modul in care lucreaza aceasta platforma, fapt ce m-am motivat sa o recomand si mai mult voua. Aplicatia poate fi folosita gratuit, existand pluginuri pentru WordPress , MediaWiki sau PHPBB dar si pentru site-urile scrise in PHP ce sunt create de la 0. Pentru a vedea documentatia tehnica sau a descarca pluginul pentru platforma de care ai nevoie, respectiv limbajul in care ai nevoie arunca o privire pe pagina de resurse a acestei aplicatii gratuite.
Concluzie
Este foarta importanta folosirea unui sistem de securitate eficient impotriva spamului gen Akismet pentru WordPress dar este si mai important sa folosim un plugin ce contribuie la imbunatatirea internetului. Motivul principal pentru care recomand acest plugin il reprezinta securitatea urmata de scopurile ce le urmareste extrem de etice si pozitive.
Cum ziceam…am ramas placut surprins despre cum functioneaza sistemul. Grozav articolul…felicitari!
Te’ai hotarat in sfarsit sa publici articolul :)) Imi place 😀
Mersi.
Toate articolele de la aceasta sectiune sunt tratate cu mai multa atentie decat stirile, de aceea timpul de care am nevoie pentru a le finaliza este ceva mai mare. 🙂
Si tu vrei sa implementezi reCAPTCHA pe blog ?
Nu il voi implementa momentan pentru ca nu am probleme atat de mari cu spamul : Akismet isi face treaba de minune iar mai nou pluginul de la Bitdefender. 🙂
Eu zic sa folosesti AdCaptcher 🙂
degeaba e recaptcha daca are optiune de ascultare a cuvintelor care poate fi sparta foarte usor 😉
As vrea sa o vad sparta optiunea de ascultare 🙂 Sunt interesat cum ai putea scapa de fundalul acela 😕
Foarte buna idea celor de la reCaptcha in legatura cu OCR.
reCaptcha este cea mai buna aplicatie de acest gen, de aceea este si cea mai folosita, chiar si de siteurile importante. De aceea Google a cumparat reCaptcha, anul trecut.
Aplicatia nu am folosit-o intenes, decat am implementat-o intr-un proiect, si pot spune ca de implementat este destul de usor.
Foarte bun articolul, aveam cateva ideei despre cum functioneaza recaptcha, insa nimic sigur.
Interesant. Nu stiam care este mecanismul lor de a genera cuvinte. Multumesc pentru articol.
Eu l-am pus pe site pentru ca in ultimele 2 luni spamul s-a triplat. Acum daca trec 2 mesaje pe zi.
@Devirusare Ai sesizat vreo diferenta in scaderea numarului de comentarii? Cred ca asta e principalul motiv pentru care refuz sa-l instalez.
@Radu Motivul principal pentru care am scris articolul este acea informatie care ai subliniat-o si tu.
@all Ma bucur ca aceasta informatie vi s-a parut utila. 🙂
e bine sa ai captcha, dar ii prefer pe cei cu 2+2 si ii urasc pe cei care ma supun la un test de inteligenta ca sa recunosc literele