Cu peste 70 de ani în urmă, când inteligența artificială a fost conceptualizată, Alan Turing a publicat o lucrare care descria cum să o identifice. Mai târziu a fost cunoscut sub numele de testul Turing și a fost folosit de zeci de ani pentru a distinge între un om și o IA.
Cu toate acestea, odată cu introducerea chatbot-urilor AI avansate, cum ar fi ChatGPT și Google Bard, devine din ce în ce mai dificil să spui dacă vorbești cu un AI. Se pune întrebarea; testul Turing este depășit? Și dacă este, care sunt alternativele?
Testul Turing este depășit?
Pentru a determina dacă testul Turing este depășit, trebuie mai întâi înțelege cum funcționează. Pentru ca un AI să treacă testul Turing, trebuie să convingă un interogator uman că este un om. Dar există o captură – IA este evaluată alături de un om și trebuie să răspundă folosind text.
Gândește-te așa; dacă sunteți interogatorul și puneți întrebări online la doi participanți folosind text, dar unul dintre ei este un model de inteligență artificială - i-ați deosebi după cinci minute? Rețineți că obiectivul testului Turing nu este de a identifica modelul AI pe baza răspunsurilor corecte, ci de a evalua dacă IA poate gândi sau se poate comporta ca un om.
Problema cu abordarea testului Turing de a identifica doar răspunsuri asemănătoare omului este că nu ia în considerare alți factori. De exemplu, inteligența modelului AI sau cunoștințele interogatorului. În plus, testul Turing este limitat doar la text și devine din ce în ce mai dificil să identifici o IA care generează o voce umană sau videoclipuri deepfake care imită comportamentul uman.
Cu toate acestea, modelele actuale de AI precum ChatGPT-4 și Google Bard nu au avansat încă până la un punct în care să poată trece în mod constant testul Turing. De fapt, dacă ești familiarizat cu AI, poți identificați textul generat de AI.
Cele mai bune 5 alternative de testare Turing
Este posibil ca viitoarele modele AI precum ChatGPT-5 ar putea trece testul Turing. Dacă se întâmplă acest lucru, am avea nevoie de teste diferite combinate cu testul Turing pentru a identifica dacă vorbim cu un AI sau cu un om. Iată cele mai bune alternative de testare Turing:
1. Testul Marcus
Gary Marcus, un renumit om de știință cognitiv și cercetător AI, a propus o alternativă la testul Turing care a fost publicat în newyorkez pentru a identifica capacitatea cognitivă a unei IA. Testul este simplu – judeci un model AI pe baza capacității sale de a viziona și înțelege videoclipuri și emisiuni TV YouTube fără subtitrări sau text. Pentru ca AI să treacă testul Marcus, ar trebui să înțeleagă sarcasmul, umorul, ironia și povestea atunci când vizionează videoclipurile și să le explice ca un om.
În acest moment, GPT-4 poate descrie imagini, dar până acum, nu există în prezent un model AI care să poată înțelege videoclipuri ca un om. Vehicule cu conducere autonomă se apropie, dar nu sunt complet autonomi și necesită senzori, deoarece nu pot înțelege totul în mediul înconjurător.
2. Testul Turing vizual
Potrivit unui document de cercetare publicat pe PNAS, testul Turing vizual poate fi folosit pentru a identifica dacă vorbiți cu un om sau cu un AI folosind chestionare de imagine. Funcționează ca testul Turing, dar în loc să răspundă la întrebări folosind texte, participanților li se arată imagini și se așteaptă să răspundă la întrebări simple în timp ce gândesc ca un om. Însă Testul Turing vizual este diferit de CAPTCHA deoarece toate răspunsurile sunt corecte, dar pentru a trece testul, IA trebuie să proceseze imaginile în mod similar cu un om.
Dincolo de asta, dacă unui AI și unui om li se arată mai multe imagini una lângă alta și li se cere să identifice imagini realiste, omul ar avea capacitatea cognitivă de a trece testul. Acest lucru se datorează faptului că modelelor AI le este dificil să distingă imaginile care nu arată ca și cum ar fi fost luate în lumea reală. De fapt, acesta este motivul pentru care poți identificați imaginile generate de AI folosind anomalii care nu au sens.
3. Testul Lovelace 2.0
Teoria conform căreia un computer nu poate crea idei originale dincolo de ceea ce a fost programat pentru a face a fost conceptualizată pentru prima dată de Ada Lovelace înainte de testul Turing. Cu toate acestea, Alan Turing a obiectat la această teorie, susținând că AI poate surprinde în continuare oamenii. Abia în 2001, liniile directoare pentru testul Lovelace au fost dezvoltate pentru a deosebi o IA de un om - și, conform thekurzweillibrary regulile au fost revizuite ulterior în 2014.
Pentru ca un AI să treacă testul Lovelace, trebuie să demonstreze că poate genera idei originale care să-și depășească pregătirea. Modelele actuale de IA precum GPT-4 nu au capacitatea de a veni cu noi invenții dincolo de cunoștințele noastre existente. In orice caz, inteligența generală artificială poate atinge această capacitate și trece testul Lovelace.
4. Testul Turing invers
Ce zici de testul Turing, dar făcut invers? În loc să încerci să afli dacă vorbești cu un om, obiectivul testul Turing invers este să păcăliți AI-ul să creadă că ești un AI. Cu toate acestea, aveți nevoie și de un alt model AI pentru a răspunde la aceleași întrebări folosind text.
De exemplu, dacă ChatGPT-4 este interogatorul, puteți înscrie Google Bard și un alt om ca participanți. Dacă modelul AI poate identifica corect participantul uman pe baza răspunsurilor, acesta a trecut testul.
Dezavantajul testului Turing invers este că nu este de încredere, mai ales având în vedere că uneori AI nu poate diferenția generat de AI și conținut scris de om.
5. Cadrul de clasificare AI
Conform cadrului de clasificare AI dezvoltat de Chris Saad, testul Turing este doar o metodă de evaluare pentru a ști dacă vorbești cu un AI. Mai succint, cadrul de clasificare AI se bazează pe teoria inteligenței multiple, care cere ca inteligența umană să îndeplinească cel puțin opt criterii diferite, care includ: ritmul muzical, inteligența logico-matematică, identificarea vizuală, inteligența emoțională, inteligența auto-reflexivă, capacitatea de gândire existențială și corpul circulaţie.
Deoarece IA este evaluată pe opt parametri diferiți, este puțin probabil să fie considerată un om chiar dacă are performanțe mai bune decât media în anumite criterii de referință. De exemplu, ChatGPT poate rezolva probleme de matematică, descrie imagini și conversa într-un limbaj natural ca un om, dar ar eșua alte categorii definite în cadrul de clasificare AI.
Testul Turing nu este concludent
Testul Turing a fost menit să fie mai mult un experiment de gândire decât un test concludent pentru a diferenția între oameni și AI. Când a fost propus inițial, a fost reperul esențial pentru măsurarea inteligenței mașinilor.
Cu toate acestea, odată cu dezvoltarea recentă a modelelor de inteligență artificială cu capacități interactive de vorbire, vizuale și auditive, testul Turing este insuficient, deoarece se limitează la conversația text. Cea mai eficientă soluție ar fi introducerea alternativelor de testare Turing care diferențiază și mai mult modelele AI de oameni.