Corectorul automat loveste din nou

Un articol de CATALIN STURZA

„Corectorul automat este un zeu poznas. Faceti cunostinta cu astronomul danez Touchpad Brahe si cu actrita franco-americana Natalie Portmanteau“, scrie James Gleick in  „The New York Times“. Numele scriitorului american Cormac McCarthy poate sa devina, odata ce trece prin corectorul automat al telefonului mobil, fie Comcast McCarthy, fie Format McCarthy. Marele zeu care e corectorul automat loveste din nou si din nou.
In trecut, eram raspunzatori pentru propriile noastre greseli de ortografie, arata James Gleick. Acum functia corectorului automat – Autocorrect – a preluat controlul. „Acesta nu e un flecustet. E un pas al evolutiei noastre – altoirea siliciului pe specia noastra care avea, odinioara, carbonul la baza, in numele inteligentei colective. Sau al lipsei de inteligenta, dupa cum e cazul aici“.
Cu cateva luni in urma, anul acesta, politia din Hall County, Georgia, a inchis Liceul West Hall pentru doua ore, dupa ce un elev a primit un SMS care spunea „gunman be at west hall today“ („un elev inarmat va deschide azi focul la West Hall“). De fapt, cel care trimisese mesajul scrisese  „gunna be at west hall today“ („trebuie sa ajung azi la West Hall“), dar corectorul automat n-a fost intru totul de acord.
Cine le spune, asadar, degetelor noastre ce sa faca? In cyberspatii colcaie revolta. Chiar daca nimeni nu prea stie cum functioneaza sau unde se afla, de fapt, acest Autocorrect, sentimentul general este ca el ne bantuie telefoanele mobile si ne vegheaza din norul virtual. Importanta sa culturala poate fi estimata daca ne uitam la blogurile care ii sunt dedicate, la raul de vaicareli de pe Twitter si la prima caricatura, aparuta anul acesta, in prestigioasa revista „The New Yorker“, care are ca subiect corectorul automat.
Toata lumea e manioasa. Oamenii dau vina pe Autocorrect pentru ca le da peste cap intentiile si dau, iarasi, vina pe Autocorrect ca nu reuseste sa le ghiceasca intentiile, atunci cand fac greseli. „Tiparesc „geocentric“ si descopar ca am scris „egocentric“, arata James Gleick. Face corectorul automat un fel de gluma cosmica? Unele cuvinte par foarte indepartate, in dictionar. „Cuticles“ (epiderma) devine „citified“ (urbanizat), „catalogues“ (cataloage) devine „fatalities“ (nenorociri), iar „Iditarod“ (numele unui oras/rau din Alaska) devine „radiator“ (radiator). Asadar, care e logica?“
De fapt, corectorul automat nu reprezinta o singura entitate, ci e rezultatul concurentei unui numar mare de algoritmi. Asa-zisul Autocorrect e un ghiveci, intersectia ideilor si a formulelor matematice concepute de multe companii, printre care cele mai importante sunt Apple, Google si Microsoft. Algoritmii lor pornesc, invariabil, de la greselile de baza: stiu ce sa faca daca scrii „mncare“. Dincolo de acest nivel, scopurile lor difera si la fel variaza ceea ce e, fiecare, in stare sa faca. Pe cele mai multe dispozitive, corectorul automat poate fi dezactivat, insa adesea nu e deloc usor sa te descurci, prin meniu, si sa descoperi cum sa-l dezactivezi. Pe telefoanele mobile, unde degetele noastre butucanoase se intepenesc printre taste, functia Autocorrect ar trebui sa ne scuteasca de efortul revizuirilor; de multe ori, reuseste doar sa ne incurce si sa ne enerveze.
Cand trecem, insa, de pe gadgeturi sau calculatoare in norul digital, algoritmul devine mult, mult mai inteligent, arata Gleick. Daca un telefon mobil compara cuvintele pe care le scriem cu un dictionar modest de termeni si corecturi, Google nu foloseste nici un fel de dictionar.  De fapt, dictionarele sunt vazute, in acest caz, de Google mai degraba ca un obstacol – atata timp cat ele tin, foarte greu, pasul cu lumea reala. In schimb, Google are acces la o baza de date decenta, alcatuita din toate cuvintele pe care oamenii le scriu, in motorul de cautare, in toata lumea. O lista de cuvinte si expresii aflata in continua evolutie care e, in fapt, „limbajul vernacular al vremurilor noastre“.
Daca scrii „kofee“ in fereastra de cautare, Google va sta cateva milisecunde sa „ghiceasca“ daca ai gresit numele cafelei („coffee“) sau ai vrut sa scrii, de fapt, numele fostului Secretar General al Natiunilor Unite, Kofi Annan. Google foloseste un algoritm probabilistic care isi are originile in cercetarile facute de laboratoarele AT&T Bell la inceputul anilor ’90. Probabilitatile se bazeaza pe modelul „noisy channel“ (in traducere aproximativa, „canalul zgomotos“), un concept fundamental al teoriei informatiei. Modelul isi imagineaza o sursa a mesajului – un utilizator ideal, cu intentii bine definite – care comunica printr-un „canal zgomotos“ ce introduce greseli de scriere, omite litere, inverseaza litere sau adauga litere in plus. De exemplu, „Coffee“ e un cuvant foarte raspandit, asa ca, trecand prin marea masa de text pe care il are la dispozitie, algoritmul va decide ca probabilitatea de aparitie a acestui cuvant e foarte mare: pe de ala parte, aceleasi date arata ca a scrie „Coffee“ cu „K“ e o greseala foarte putin frecventa. Algoritmul combina cele doua probabilitati; in plus, invata din experienta si aduna indicii suplimentare din context.
Si, cu cat corectorul automat devine mai bun, cu atat vom ajunge sa ne bazam mai mult pe el, scrie James Gleick. „E ceva care deja se intampla. Oamenii care, ieri, uitau cum sa faca adunari si inmultiri vor uita, in curand, cum sa scrie corect. Una cate una, ne externalizam functiile noastre mentale spre creierul protetic global. Pot sa ma obisnuiesc si cu asta. Ne externalizam memoria, ne externalizam orientarea geografica, atunci, de ce nu, haideti sa ne externalizam si ortografia.“

Comentariile sunt inchise.

epaper Legenda comenzi: instructiuni_epaper