O echipă de cercetători chinezi spune că a dezvoltat un așa-zis „cenzor bazat pe inteligență artificială”, care examinează și filtrează „informațiile dăunătoare” din mediul online cu o acuratețe fără precedent, se arată în articolul citat.
În mod normal, explică autorii, cenzorii tradiționali automați se bazează pe cuvinte-cheie pentru a face asta și ating cu greu o acuratețe de 70%, pe când inteligența artificială – care trebuie „antrenată” de oameni – a ajuns la o acuratețe de 80 de procente în ultimii ani.
Pe de altă parte, membrii echipei de la Universitatea Shenyang Ligong și cercetătorii de la Academia Chineză de Științe susțin că aplicația lor nu trebuie instruită de oameni și că are o acuratețe de 91%.
Aplicația ar fi utilă în special pentru „identificarea și filtrarea informațiilor sensibile din mediul online”, a scris Li Shu, cercetătoarea care a condus proiectul, în „Journal of Chinese Computer Systems”.
Cenzura pe internet făcută manual
China are mai bine de 900 de milioane de utilizatori ai internetului, mai mulți decât în orice altă țară, și lucrează la construirea celei mai vaste rețele 5G, pentru a spori viteza sistemului de comunicații. Internetul este însă strict controlat în țară, multe site-uri fiind blocate, iar printre acestea se numără Google, Facebook, Twitter, unele site-uri de presă din străinătate. De asemenea, pe site-urile care sunt disponibile utilizatorilor, anumite tipuri de conținut sunt interzise.
Subiectele interzise sunt numeroase – pornografie, droguri, folosirea armelor, terorism, dar și atacuri la adresa liderilor Partidului Comunist.
Pentru computere, însă, identificarea lor este o provocare. Limba chineză este una dintre cele mai complexe din lume, având în jur de 10.000 de caractere. Unele cuvinte sensibile – cum ar fi „armă” -, pot ajunge să fie cenzurate în contexte inofensive, în vreme ce informațiile ilegale circulă fără probleme când nu sunt folosite cuvintele-cheie interzise.
Din acest motiv, guvernul din China s-a bazat pe armate de cenzori care să filtreze manual conținutul, însă procesul devine tot mai costisitor și greoi, în contextul avalanșei de informații revărsate permanent în mediul online.
Li, care este cadru didactic asociat la Universitatea Shenyang Ligong, spune că tehnologia dezvoltată de echipa ei poate ține pasul cu evoluția rapidă a limbii, recurgând la un dicționar care conține atât cuvintele sensibile, cât și diverse forme ale acestora.
Ea spune că tehnologia poate, de asemenea, să citească printre rânduri și să descopere astfel textele scrise în așa fel încât să păcălească procesele automate clasice de filtrare a conținutului.
În mediul online, mulți chinezi folosesc diverse trucuri pentru a păcăli tehnologia existentă – recurg la omonime ale termenilor interziși sau plasează cratime între caractere.
Tehnologia vine chiar de la Google
Parțial, a mai arătat Li, această nouă tehnologie a venit de la Google. În 2017, Google a dezvoltat un model de limbaj open-source, BERT, pentru ca motorul de căutare să „înțeleagă” mai bine termenii căutați. BERT poate citi un cuvânt în mai multe contexte, făcând astfel diferența între expresii cu sens diferit, care folosesc același termen.
BERT nu este însă folosit pentru cenzură și nici designerii lui nu l-au conceput cu acest scop, el neputând să înțeleagă mai mult de 512 cuvinte.
În cazul textelor lungi, echipa lui Li le fragmentează, lasă BERT să proceseze segmentele mai scurte de text și apoi folosește un alt instrument bazat pe inteligență artificială pentru a înțelege pe deplin sensul mesajului.
Google nu a oferit o reacție la articolul publicației din China.
China investește masiv în inteligență artificială, iar tehnologia devine tot mai mult parte integrantă a vieții cotidiene din țară, un exemplu elocvent fiind folosirea camerelor de supraveghere video cu recunoaștere facială, utilizate atât în spații publice sau magazine, cât și în scopuri militare.
FOTO: 123rf