Modelele de inteligență artificială precum ChatGPT și Bard sunt antrenate folosind date create de oameni. Cu cât ingerează mai multe date, cu atât devin mai deștepți în a imita inteligența și creativitatea umană. Jucători mari din industria AI, cum ar fi OpenAI și Meta, au implementat modele de limbaj mari antrenate prin răzuirea textului și a cărților disponibile online pentru a extrage date.

Din cauza modului în care sunt instruiți LLM, era inevitabil să existe un conflict între legea drepturilor de autor și inteligența artificială. Acum, găinile vin acasă la adăpost, deoarece Sarah Silverman și alți artiști dau în judecată OpenAI și Meta pentru încălcarea drepturilor de autor.

În un proces colectiv [PDF] depus în California, comediantul Sarah Silverman și alți scriitori (Christopher Golden și Richard Kadrey) încearcă să recupereze daunele împotriva OpenAI și Meta din cauza încălcării drepturilor de autor. Procesul susține că OpenAI și Meta au răzuit cărți protejate prin drepturi de autor de pe site-uri web ale piratilor pentru a-și antrena modelele AI. Acesta este echivalentul unui model AI care își descarcă seturile de date de antrenament din Piratebay fără a-i compensa pe autori.

instagram viewer

Întâmplător, a proces colectiv separat [PDF] împotriva OpenAI susține că compania a folosit informații private neautorizate pentru a instrui ChatGPT. De asemenea, Google se confruntă cu un proces similar pentru presupusa folosire a datelor furate pentru a instrui Google Bard. Acesta este motivul pentru care ar trebui fă un obicei din a-ți proteja informațiile personale, deși publicarea lucrărilor și datele personale private nu sunt aceeași.

Care sunt șansele ca Sarah Silverman să câștige procesul?

Credit imagine: freepik

Silverman și alți artiști susțin că ChatGPT își poate rezuma cu acuratețe cărțile atunci când vi se solicită. Plângerea susține că acest lucru nu ar fi posibil dacă modelul AI nu ar avea acces la materialul protejat prin drepturi de autor. Cu toate acestea, dacă ChatGPT a fost instruit folosind miliarde de texte de pe internet, probabil că a găsit articole, comentarii și postări pe rețelele sociale care discutau despre cărți.

Mai mult, Meta a dezvăluit de unde a achiziționat cărțile pe care le-a folosit pentru a-și antrena modelul AI – sursa a fost urmărită pe un site web cu torrent de cărți electronice. În mod similar, procesul de acțiune colectivă împotriva OpenAI menționează, de asemenea, site-uri web ilegale unde OpenAI este suspectat că a obținut materialele protejate prin drepturi de autor, dar OpenAI încă nu a confirmat sursele sale.

Dacă se dovedește că OpenAI și Meta au folosit site-uri web de torrent ilegale pentru a achiziționa materiale protejate prin drepturi de autor pentru a-și antrena modelele AI, Silverman ar putea avea șansa de a câștiga procesul. Cu toate acestea, modelele AI sunt un teritoriu neexplorat fără precedent pe care să se bazeze instanțele pentru a lua o hotărâre bazată pe încălcarea drepturilor de autor AI. De fapt, acesta este unul dintre motivele pentru care UE a propus un act AI.

Care este viitorul modelelor AI și al legii drepturilor de autor?

Suntem încă în primele zile ale AI pentru a ști cum se va adapta la legea drepturilor de autor. Este și mai complex să încerci să-ți dai seama care deține drepturile de autor pentru crearea AI. Dar pentru creatorii umani, există reglementări care îi protejează împotriva accesării altcuiva la materialul lor protejat de drepturi de autor fără compensație, consimțământ sau credit. Dacă regulile există pentru oameni, se vor aplica ele modelelor AI?

Parlamentul UE a elaborat cea mai apropiată privire asupra viitorului despre modul în care modelele AI vor respecta legea drepturilor de autor. Dacă Actul AI al UE este aprobat în lege, modelele AI precum ChatGPT și Bard vor fi obligate să publice toate sursele setului de date și datele protejate prin drepturi de autor utilizate pentru instruire. Acest lucru va ajuta la clarificarea oricărei confuzii dacă modelele AI au accesat cărți, filme, muzică și fotografii protejate prin drepturi de autor pentru antrenament prin intermediul site-urilor web ilegale de piraterie.

Decizia procesului de acțiune colectivă AI va stabili un precedent legal

Modelele de limbă mari pot răzui toate colțurile internetului pentru datele folosite în antrenament. Dar ar fi ei responsabili pentru încălcarea drepturilor de autor dacă accesează site-uri web ilegale de torrent pentru a obține datele? Și dacă o fac, poți dovedi asta?

Indiferent de rezultat, procesele de acțiune colectivă împotriva companiilor de tehnologie care dețin cele mai populare modele AI vor crea un precedent care va fi relevant în viitor.