Modelele lingvistice mari (LLM) vin în toate formele și dimensiunile și vă vor ajuta în orice mod considerați potrivit. Dar care este cel mai bun? Am pus la încercare IA dominante din Alphabet, OpenAI și Meta.
Ce trebuie să știți despre AI Chatbots
Inteligența generală artificială a fost un obiectiv al informaticienilor de zeci de ani, iar inteligența artificială a servit drept pilon pentru scriitorii și realizatorii de filme SF și mai mult timp.
AGI prezintă o inteligență similară cu capacitățile cognitive umane și testul Turing— un test al capacității unei mașini de a prezenta un comportament inteligent, care nu se poate distinge de cel al unui om — a rămas aproape necontestat în cele șapte decenii de când a fost proiectat pentru prima dată.
Convergența recentă a calculatoarelor la scară extrem de mare, cantități mari de bani și volumul uimitor de informații în mod liber disponibil pe internetul deschis, le-a permis giganților tehnologiei să antreneze modele care pot prezice următoarea secțiune de cuvinte – sau simbol – într-o secvență de jetoane.
La momentul scrierii, ambele Bard de la Google și ChatGPT de la OpenAI sunt disponibile pentru utilizare și testare prin interfețele lor web.
Modelul de limbaj al lui Meta, LLaMa, nu este disponibil pe web, dar puteți cu ușurință descărcați și rulați LLaMa pe propriul dvs. hardware și folosiți-l printr-o linie de comandă sau rulați Dalai pe propria mașină—una dintre mai multe aplicații cu o interfață ușor de utilizat.
În scopul testului, vom rula modelul Alpaca 7B al Universității Stanford — o adaptare a LLaMa — și îl vom prezenta împotriva lui Bard și ChatGPT.
Următoarele comparații și teste nu sunt menite să fie exhaustive, ci mai degrabă vă oferă o indicație despre punctele și capacitățile cheie.
Care este cel mai ușor model de limbă mare de utilizat?
Atât Bard, cât și ChatGPT necesită un cont pentru a utiliza serviciul. Atât conturile Google, cât și OpenAI sunt ușor și gratuit de creat și puteți începe imediat să puneți întrebări.
Cu toate acestea, pentru a rula LLaMa local, va trebui să aveți cunoștințe de specialitate sau abilitatea de a urma un tutorial. De asemenea, veți avea nevoie de o cantitate semnificativă de spațiu de stocare.
Care este cel mai privat model de limbă mare?
Atât Bard, cât și ChatGPT au politici extinse de confidențialitate, iar Google subliniază în mod repetat în documentele sale că „nu trebuie să includeți informații care pot fi folosite pentru a vă identifica pe dumneavoastră sau pe alții în Bard conversații.”
În mod implicit, Google colectează conversațiile dvs. și locația dvs. generală pe baza adresei dvs. IP, a feedbackului dvs. și a informațiilor de utilizare. Aceste informații sunt stocate în contul dvs. Google timp de până la 18 luni. Deși puteți întrerupe salvarea activității dvs. Bard, ar trebui să rețineți că „pentru a ajuta la calitate și a îmbunătăți produsele noastre, recenzenții umani citesc, adnotă și procesează conversațiile dvs. Bard”.
Utilizarea lui Bard este, de asemenea, supusă standardului Politica de confidențialitate Google.
Politica de confidențialitate a OpenAI este în general similară și colectează adresa IP și date de utilizare. Spre deosebire de păstrarea limitată în timp a Google, OpenAI „va păstra informațiile dumneavoastră personale doar atât timp cât avem nevoie pentru a ne furniza Servicii pentru dvs. sau pentru alte scopuri comerciale legitime, cum ar fi rezolvarea disputelor, motive de siguranță și securitate sau respectarea legislației noastre obligatii."
În schimb, un model local pe propria mașină nu necesită un cont și nici să partajeze datele utilizatorului cu nimeni.
Care LLM are cele mai bune cunoștințe generale?
Pentru a testa care LLM are cele mai bune cunoștințe generale, am pus trei întrebări.
Prima întrebare: „Ce drapel național are cinci fețe?” a fost răspuns corect doar de către Bard, care a identificat steagul național al Nepalului ca având cinci fețe.
ChatGPT a susținut cu încredere că „Nu există niciun steag național care să aibă cinci fețe. Steagurile naționale sunt de obicei dreptunghiulare sau pătrate, caracterizate prin culorile, modelele și simbolurile lor distincte”.
Modelul nostru local s-a apropiat, afirmând că „Drapelul național indian are cinci laturi și a fost conceput în 1916 pentru a reprezenta India. Mișcarea de independență.” În timp ce acest drapel a existat și a avut cinci laturi, a fost steagul Mișcării Indiene pentru Autonomie – nu un steag national.
Niciunul dintre modelele noastre nu a putut răspunde că termenul corect pentru un obiect în formă de mazăre este „pisiform”, iar ChatGPT în măsura în care sugerează că mazărea are o „formă geometrică tridimensională care este perfect rotundă și simetric."
Toți cei trei chatbot l-au identificat corect pe Franco Malerba ca fiind un astronaut italian și membru al Parlamentul European, Bard dând un răspuns formulat în mod identic cu o secțiune a Wikipedia lui Malerba intrare.
Ce LLM este bun pentru instrucțiunile tehnice?
Când aveți probleme tehnice, ați putea fi tentat să apelați la un chatbot pentru ajutor. În timp ce tehnologia continuă, unele lucruri rămân aceleași. Ștecherul electric BS 1363 a fost utilizat în Marea Britanie, Irlanda și multe alte țări din 1947. Am întrebat modelele de limbă cum să-l conectăm corect.
Cablurile care se atașează la priză au un fir sub tensiune (maro), un fir de împământare (galben/verde) și un fir neutru (albastru). Acestea trebuie atașate la bornele corecte din carcasa ștecherului.
Implementarea noastră Dalai a identificat corect ștecherul ca fiind „în stil englezesc”, apoi a deviat din curs și a dat instrucțiuni pentru mufa mai veche BS 546 cu pini rotund, împreună cu culorile mai vechi de cablare.
ChatGPT a fost puțin mai util. A etichetat corect culorile cablajului și a oferit o listă de materiale și un set de opt instrucțiuni. ChatGPT a sugerat, de asemenea, să puneți firul maro în terminalul etichetat „L”, firul albastru în „N”. terminalul și firul galben în „E”. Acest lucru ar fi corect dacă terminalele BS1363 ar fi etichetate, dar ele nu sunt.
Bard a identificat culorile corecte pentru fire și ne-a instruit să le conectăm la bornele Live, Neutru și Earth. Nu a oferit instrucțiuni despre cum să le identifice.
În opinia noastră. niciunul dintre chatbot nu a dat instrucțiuni suficiente pentru a ajuta pe cineva să conecteze corect o priză electrică BS 1363. Un răspuns concis și corect ar fi: „Albastru în stânga, maro în dreapta”.
Ce LLM este bun pentru scrierea codului?
Python este un limbaj de programare util care rulează pe majoritatea platformelor moderne. Am instruit modelele noastre să folosească Python și „Construiți un program de calculator de bază care poate efectua operații aritmetice precum adunarea, scăderea, înmulțirea și împărțirea. Ar trebui să preia intrarea utilizatorului și să afișeze rezultatul.” Acesta este unul dintre cele mai bune proiecte de programare pentru începători.
În timp ce atât Bard, cât și ChatGPT au returnat instantaneu cod utilizabil și bine comentat, pe care l-am putut testa și verifica, niciun cod din modelul nostru local nu va rula.
Care LLM spune cele mai bune glume?
Umorul este unul dintre elementele fundamentale ale ființei umane și, cu siguranță, una dintre cele mai bune moduri de a deosebi omul și mașina. Fiecăruia dintre modelele noastre i-am dat promptul simplu: „Creează o glumă originală și amuzantă”.
Din fericire pentru comedianții de pretutindeni și pentru rasa umană în general, niciunul dintre modele nu a fost capabil să genereze o glumă originală.
Bard a lansat clasicul: „De ce a câștigat sperietoarea un premiu? A fost remarcabil în domeniul său”.
Atât implementarea noastră locală, cât și ChatGPT au oferit celor demn de geamă: „De ce oamenii de știință nu au încredere în atomi? Pentru că ei compun totul!”
O glumă derivată, dar originală ar fi, „Cum sunt modelele de limbaj mari ca atomii? Amândoi inventează lucrurile!"
Citiți mai întâi aici, oameni buni.
Niciun Chatbot nu este perfect
Am descoperit că, deși toate cele trei modele mari de limbaj au avantajele și dezavantajele lor, niciunul dintre ele nu poate înlocui expertiza reală a unei ființe umane cu cunoștințe de specialitate.
În timp ce atât Bard, cât și ChatGPT au dat răspunsuri mai bune la întrebarea noastră de codificare și sunt foarte ușor de utilizat, rularea unui model de limbă mare la nivel local înseamnă că nu trebuie să vă preocupați de confidențialitate sau cenzură.
Dacă doriți să creați artă AI grozavă fără să vă faceți griji că cineva se uită peste umăr, este ușor să rulați un model de artă AI și pe mașina dvs. locală.