GPT-4 este aici și acestea sunt noile funcții pe care ar trebui să le verificați.

OpenAI și-a lansat în sfârșit actualizarea sa mult așteptată GPT, GPT-4. Modelul de limbă mare (LLM) vine cu câteva funcții și capabilități noi puternice care au șocat deja utilizatorii din întreaga lume.

Pe lângă faptul că este semnificativ mai bun decât GPT-3.5, LLM existent care alimentează chatbot-ul viral ChatGPT al OpenAI, GPT-4 poate să înțeleagă intrări mai complexe, are o limită de introducere a caracterelor mult mai mare, are capacități multimodale și se pare că este mai sigur utilizare.

1. GPT-4 poate înțelege intrări mai complexe

Una dintre cele mai mari caracteristici noi ale GPT-4 este capacitatea sa de a înțelege solicitări mai complexe și mai nuanțate. Conform OpenAI, GPT-4 „expune performanțe la nivel uman pe diferite repere profesionale și academice”.

Acest lucru a fost demonstrat prin aplicarea GPT-4 prin mai multe examene la nivel uman și teste standardizate, cum ar fi SAT, BAR și GRE, fără pregătire specifică. Nu numai că GTP-4 a înțeles și a rezolvat aceste teste cu un scor relativ mare în general, dar a depășit și predecesorul său, GPT-3.5, de fiecare dată.

instagram viewer

Credit imagine: OpenAI

Capacitatea de a înțelege solicitări de introducere mai nuanțate este, de asemenea, ajutată de faptul că GPT-4 are o limită de cuvinte mult mai mare. Noul model poate gestiona solicitări de intrare de până la 25.000 de cuvinte (pentru context, GPT-3.5 a fost limitat la 8.000 de cuvinte). Acest lucru va afecta direct detaliile pe care utilizatorii le pot introduce în solicitările lor, oferind astfel modelului mult mai multe informații cu care să lucreze și producând rezultate mai lungi.

GPT-4 acceptă, de asemenea, peste 26 de limbi, inclusiv limbi cu resurse reduse, cum ar fi letona, galeza și swahili. Când a fost evaluat cu precizie de trei lovituri pe benchmark-ul MMLU, GPT-4 a depășit GPT-3.5, precum și alte LLM-uri de top, cum ar fi PaLM și Chinchilla, în ceea ce privește performanța în limba engleză în 24 de limbi.

2. Capacități multimodale

Versiunea anterioară a ChatGPT a fost limitat la doar solicitări text. În schimb, una dintre cele mai noi caracteristici ale GPT-4 este capabilitățile sale multimodale. Modelul poate accepta atât solicitări de text, cât și de imagine.

Aceasta înseamnă că AI poate accepta o imagine ca intrare și o poate interpreta și înțelege exact ca un mesaj text. Această capacitate acoperă toate dimensiunile și tipurile de imagini și text, inclusiv documente care le combină pe cele două, schițe desenate manual și chiar capturi de ecran.

Cu toate acestea, capacitățile de citire a imaginilor GPT-4 depășesc simpla interpretare a acestora. OpenAI a prezentat acest lucru în fluxul său pentru dezvoltatori (mai sus), unde a furnizat GPT-4 o machetă desenată manual a unui site web de glumă. Modelul a fost însărcinat să scrie cod HTML și JavaScript pentru a transforma macheta într-un site web, înlocuind în același timp glumele cu altele reale.

GPT-4 a scris codul folosind aspectul specificat în machetă. La testare, codul a produs un site de lucru cu, după cum puteți ghici, glume reale. Asta inseamna Progresele AI vor însemna sfârșitul programării? Nu chiar, dar este totuși o caracteristică care va fi utilă pentru a ajuta programatorii.

Oricât de promițătoare pare această caracteristică, este încă în previzualizarea cercetării și nu este disponibilă public. În plus, modelul necesită mult timp pentru a procesa intrările vizuale, OpenAI însuși afirmând că ar putea necesita muncă și timp pentru a deveni mai rapid.

3. Dirijare mai mare

OpenAI susține, de asemenea, că GPT-4 are un grad ridicat de direcție. De asemenea, a îngreunat AI să spargă caracterul, ceea ce înseamnă că este mai puțin probabil să eșueze atunci când este implementat într-o aplicație pentru a juca un anumit personaj.

Dezvoltatorii își pot prescrie stilul și sarcina AI descriind direcția în mesajul „sistem”. Aceste mesaje permit utilizatorilor API să personalizeze puternic experiența utilizatorului în anumite limite. Deoarece aceste mesaje sunt, de asemenea, cea mai ușoară modalitate de a „jailbreak” modelul, ei lucrează și pentru a le face mai sigure. Demo-ul pentru GPT-4 a reușit acest punct, determinând un utilizator să încerce să oprească GPT-4 să fie un tutor socratic și să răspundă la întrebarea lor. Cu toate acestea, modelul a refuzat să rupă caracterul.

4. Siguranță

OpenAI a petrecut șase luni făcând GPT-4 mai sigur și mai aliniat. Compania susține că este cu 82% mai puțin probabil să răspundă la solicitările de conținut neadecvat sau altfel interzis, cu 29% mai puțin probabil să să răspundă în conformitate cu politicile OpenAI la solicitările sensibile și cu 40% mai multe șanse de a produce răspunsuri concrete în comparație cu GPT-3.5.

Nu este perfect și te poți aștepta în continuare să „halucineze” din când în când și poate greși în predicțiile sale. Sigur, GPT-4 are percepții și putere de predicție mai bune, dar totuși nu ar trebui să ai încredere orbește în AI.

5. Imbunatatiri ale performantei

Pe lângă evaluarea performanței modelului la examenele umane, OpenAI a evaluat și botul pe benchmark-uri tradiționale concepute pentru modelele de învățare automată.

Acesta susține că GPT-4 „depășește considerabil” LLM-urile existente și „cele mai multe modele de ultimă generație”. Aceste repere includ MMLU, AI2 Reasoning Challenge (ARC), WinoGrande, HumanEval și Drop menționate mai sus, toate testează capabilitățile individuale.

Veți găsi rezultate similare atunci când comparați performanța pe criteriile de referință de viziune academică. Testele efectuate includ VQAv2, TextVQA, ChartQA, AI2 Diagram (AI2D), DocVQA, Infographic VQA, TVQA și LSMDC, toate GPT-4 în frunte. Cu toate acestea, OpenAI a declarat că rezultatele GPT-4 în aceste teste „nu reprezintă pe deplin amploarea capacităților sale”, deoarece cercetătorii continuă să găsească lucruri noi și mai provocatoare pe care modelul le poate aborda.

Pas mic pentru GPT-4, Salt uriaș pentru AI

Cu mai multă acuratețe, siguranță de utilizare și capabilități avansate, GPT-4 a fost lansat publicului prin planul de abonament lunar ChatGPT+, care costă 20 pe lună. În plus, OpenAI a colaborat cu diferite organizații pentru a începe să construiască produse destinate consumatorilor cu GPT-4. Microsoft Bing, Duolingo, Stripe, Be My Eyes și Khan Academy, printre altele, au implementat deja GPT-4 în produsele lor.

GPT-4 poate fi o actualizare incrementală față de GPT-3.5, dar este un câștig uriaș pentru AI în general. Pe măsură ce modelul devine mai accesibil, atât pentru utilizatorul obișnuit, cât și pentru dezvoltatori prin intermediul API-ului său, se pare că va fi un argument bun pentru implementările LLM în toate domeniile.