Anonimatul online a fost mult timp o componentă esențială a internetului, permițând utilizatorilor să își exprime opiniile sub pseudonime, fie din motive de libertate de exprimare, fie pentru a-și proteja identitatea. Totuși, un nou studiu sugerează că această protecție ar putea deveni tot mai fragilă, pe măsură ce modelele de Inteligență Artificială devin capabile să identifice persoanele din spatele conturilor anonime.
Cercetarea, publicată pe platforma arXiv, arată că modelele lingvistice de mari dimensiuni pot corela activitatea online a unui utilizator cu alte profiluri aparent fără legătură, ridicând semne de întrebare asupra viitorului pseudonimatului pe internet.
Cum poate AI să reconstruiască identitatea din fragmente de date
Cercetătorii au pornit de la ideea că deanonimizarea, deși considerată teoretic posibilă, era până acum prea complexă și costisitoare pentru a fi aplicată la scară largă. Ei au testat însă ipoteza că noile modele de limbaj sunt suficient de avansate pentru a schimba această realitate.
Pentru experiment, a fost creat un sistem automat care imită logica unui investigator uman. Acesta analizează istoricul postărilor de pe platforme precum Reddit sau Hacker News, extrăgând informații din texte neorganizate, de la stilul de scriere și glume, până la detalii despre educație sau interese personale.
Aceste fragmente sunt apoi transformate într-un profil matematic al utilizatorului, care este comparat cu milioane de alte profiluri disponibile online, inclusiv din surse precum rețele profesionale. Sistemul caută potriviri posibile, le evaluează și atribuie un scor de încredere fiecărei asocieri, evitând concluziile atunci când incertitudinea este prea mare.
Rezultate surprinzătoare în testele pe mii de profiluri
Pentru a testa eficiența metodei, cercetătorii au analizat aproape 1.000 de profiluri de pe platforma LinkedIn și le-au comparat cu conturi de pe Hacker News. Deși identitatea reală a utilizatorilor era cunoscută, informațiile evidente au fost eliminate pentru a simula anonimatul.
Rezultatele au arătat că sistemul bazat pe Inteligență Artificială a reușit să facă potriviri corecte în proporție de până la 67%, la un nivel ridicat de precizie. Prin comparație, metodele tradiționale, fără AI, au avut performanțe semnificativ mai slabe.
Mai mult, sistemul a reușit să identifice aceleași persoane chiar și în comunități diferite de pe Reddit, inclusiv în cazurile în care acestea foloseau conturi separate sau postau în perioade diferite. Costul estimat al identificării unui utilizator a fost relativ redus, între 1 și 4 dolari în resurse de calcul pentru fiecare corelare reușită.

Anonimatul online, din ce în ce mai fragil
Cercetătorii concluzionează că anonimatul bazat pe pseudonime nu mai oferă o protecție reală, în condițiile în care fiecare fragment de informație publicată online poate contribui la reconstruirea identității unei persoane. Cu cât utilizatorii lasă mai multe urme digitale, cu atât crește probabilitatea de a fi identificați.
Potrivit autorilor, aceste sisteme ar putea avea în viitor aplicații în domenii precum securitatea cibernetică sau investigațiile digitale, însă ridică în același timp întrebări serioase despre viața privată și limitele expunerii online.
„Responsabilitatea se construiește împreună.
Intră pe canalul nostru de WhatsApp Responsabil și fii parte dintr-o comunitate care vrea să schimbe România în bine.
Leave a comment