Descoperiți puterea API-ului OpenAI și toate posibilitățile pe care le oferă.
Puterea generativă a ChatGPT a provocat o frenezie în lumea tehnologiei de la lansare. Pentru a împărtăși intuiția AI, OpenAI a lansat API-urile ChatGPT și Whisper pe 1 martie 2023, pentru ca dezvoltatorii să exploreze și să consume în aplicație.
API-urile OpenAI oferă multe puncte finale valoroase care facilitează integrarea AI. Să explorăm puterea API-urilor OpenAI pentru a vedea cum vă pot beneficia.
Ce poate face API-ul OpenAI?
The OpenAI API pachete într-o grămadă de utilitare pentru programatori. Dacă intenționați să oferiți zilnic AI în aplicație, OpenAI vă va ușura viața cu următoarele abilități.
conversație
Punctul final de finalizare a chat-ului API OpenAI ajută utilizatorul final să creeze o sesiune interactivă naturală, prietenoasă cu oamenii, cu un asistent virtual folosind modelul GPT-3.5-turbo.
În culise, apelul API folosește o serie de mesaje de roluri și conținut. Din partea utilizatorului, conținutul este un set de instrucțiuni pentru asistentul virtual, care implică utilizatorul, în timp ce pentru model, conținutul este răspunsul acestuia.
Rolul de nivel superior este sistemul, unde definiți funcția generală a asistentului virtual. De exemplu, atunci când programatorul spune sistemului ceva de genul „ești un asistent virtual util”, te aștepți ca acesta să răspundă la diferite întrebări în limita capacității sale de învățare.
După ce i-am spus că este „un asistent virtual util”, iată cum a mers una dintre conversațiile noastre din linia de comandă cu modelul GPT-3.5-turbo:
Puteți chiar îmbunătăți performanța modelului prin furnizarea de parametri precum temperatura, prezența-penalizare, frecvența-penalizare și multe altele. Dacă ați folosit vreodată ChatGPT, știți deja cum funcționează modelul de finalizare a chat-ului OpenAI.
Completarea textului
API-ul de completare a textului oferă funcționalități de conversație, de inserare de text și de completare a textului, bazate pe modele avansate GPT-3.5.
Modelul campion din punctul final de completare a textului este text-davinci-003, care este considerabil mai intuitiv decât modelele de limbaj natural GPT-3. Punctul final acceptă o solicitare a utilizatorului, permițând modelului să răspundă în mod natural și să completeze propoziții simple până la complexe, folosind text prietenos pentru oameni.
Deși punctul final de completare a textului nu este la fel de intuitiv ca punctul final de chat, acesta devine mai bun - pe măsură ce creșteți jetoanele de text furnizate modelului text-davinci-003.
De exemplu, am obținut câteva completări pe jumătate când am plasat modelul pe un max_tokens de șapte:
Cu toate acestea, creșterea numărului max_tokens la 70 a generat gânduri mai coerente:
Vorbire în text
Puteți transcrie și traduce vorbirea audio folosind punctele finale de transcriere și traducere OpenAI. Punctele finale din vorbire în text se bazează pe modelul Whisper v2-large, dezvoltat prin supraveghere slabă la scară largă.
Cu toate acestea, OpenAI spune că nu există nicio diferență între modelul său Whisper și cel în sursă deschisă. Prin urmare, oferă oportunități nesfârșite de integrare a unui transcritor multilingv și a unui traducător AI în aplicația dvs. la scară.
Utilizarea punctului final este simplă. Tot ce trebuie să faceți este să furnizați modelului un fișier audio și să sunați la openai. Audio.traducere sau openai. Audio.transcrie punctul final pentru a-l traduce sau respectiv transcrie. Aceste puncte finale acceptă o dimensiune maximă de fișier de 25 MB și acceptă majoritatea tipurilor de fișiere audio, inclusiv mp3, mp4, MPEG, MPGA, m4a, wav și webm.
Comparație de text
Punctul final de comparare a textului API OpenAI măsoară relația dintre texte folosind modelul text-embedding-ada-002, un model de încorporare de a doua generație. API-ul de încorporare folosește acest model pentru a evalua relația dintre texte pe baza distanței dintre două puncte vectoriale. Cu cât diferența este mai mare, cu atât textele comparate sunt mai puțin legate.
Punctul final de încorporare include gruparea de text, diferențe, relevanță, recomandări, sentimente și clasificare. În plus, se încarcă pe volum de token.
Deși documentația OpenAI spune că puteți utiliza celelalte modele de încorporare de prima generație, primul este mai bun cu un preț mai ieftin. Cu toate acestea, OpenAI avertizează că modelul de încorporare ar putea prezenta părtiniri sociale față de anumite persoane, așa cum s-a dovedit în teste.
Completarea codului
Punctul final de completare a codului este construit pe OpenAI Codex, un set de modele antrenate folosind limbajul natural și miliarde de linii de cod din depozitele publice.
Punctul final este în versiune beta limitată și gratuit la momentul scrierii, oferind suport pentru multe limbaje de programare moderne, inclusiv JavaScript, Python, Go, PHP, Ruby, Shell, TypeScript, Swift, Perl și SQL.
Cu modelul code-davinci-002 sau code-cushman-001, punctul final de completare a codului poate insera automat linii de cod sau poate roti blocuri de cod de la solicitarea unui utilizator. În timp ce cel din urmă model este mai rapid, primul este puterea punctului final, deoarece include inserții de cod pentru completarea automată a codului.
De exemplu, puteți genera un bloc de cod trimițând un prompt către punctul final în comentariul în limba țintă.
Iată câteva răspunsuri pe care le-am primit când am încercat să generăm câteva blocuri de cod în Python și JavaScript prin intermediul terminalului:
Generare de imagini
Aceasta este una dintre cele mai intuitive caracteristici ale API-ului OpenAI. Pe baza modelului de imagine DALL.E, funcționalitatea de imagine a API-ului OpenAI oferă puncte finale pentru generarea, editarea și crearea de variații de imagine din solicitările în limbaj natural.
Deși nu are încă funcții avansate, cum ar fi upscaling, deoarece este încă în versiune beta, ieșirile sale nescalate sunt mai impresionante decât cele generative. modele de artă precum Midjourney și Difuziune stabilă.
Când atingeți punctul final de generare a imaginii, trebuie doar să furnizați un prompt, dimensiunea imaginii și numărul de imagini. Dar punctul final de editare a imaginii necesită să includeți imaginea pe care doriți să o editați și o mască RGBA care marchează punctul de editare în plus față de ceilalți parametri.
Punctul final de variație, pe de altă parte, necesită doar imaginea țintă, numărul de variații și dimensiunea de ieșire. La momentul scrierii, punctele finale ale imaginii beta ale OpenAI pot accepta numai cadre pătrate în intervalul 256x256, 512x512 și 1024x1024 pixeli.
Am creat o aplicație simplă de generare a imaginilor folosind acest punct final și, deși a omis câteva detalii, a dat un rezultat incredibil:
Cum să utilizați API-ul OpenAI
Utilizarea API-ului OpenAI este simplă și urmează modelul convențional de consum API.
- Instalați openai pachet folosind pip: pip install openai.Dacă utilizați în schimb Node, puteți face acest lucru folosind npm: npm instalează openai.
- Luați-vă cheile API: Conectați-vă la tabloul de bord OpenAI și faceți clic pe pictograma profilului din dreapta sus. Mergi la Vedeți cheile API și faceți clic Creați o nouă cheie secretă pentru a genera cheia secretă API.
- Efectuați apeluri API către punctele finale ale modelului dvs. printr-un limbaj pe partea de server, cum ar fi Python sau JavaScript (Node). Introduceți-le la API-urile dvs. personalizate și testați-vă punctele finale.
- Apoi preluați API-uri personalizate prin JavaScript cadre precum React, Vue sau Angular.
- Prezentați datele (cererile utilizatorilor și răspunsurile modelului) într-o interfață de utilizare atrăgătoare din punct de vedere vizual, iar aplicația dvs. este gata pentru utilizare în lumea reală.
Ce puteți crea cu API-ul OpenAI?
API-urile OpenAI creează puncte de intrare pentru utilizarea în viața reală a învățării automate și a învățării prin consolidare. În timp ce oportunitățile pentru creativitate abundă, iată câteva dintre ceea ce puteți construi cu API-urile OpenAI:
- Integrați un chatbot de asistent virtual intuitiv în site-ul sau în aplicația dvs. folosind punctul final de finalizare a chat-ului.
- Creați o aplicație de editare și manipulare a imaginilor care poate insera în mod natural un obiect într-o imagine în orice punct specificat folosind punctele finale de generare a imaginii.
- Construiți un model personalizat de învățare automată de la zero folosind punctul final de reglare fină a modelului OpenAI.
- Remediați subtitrările și traducerile pentru videoclipuri, audio și conversații live folosind punctul final al modelului de vorbire în text.
- Identificați sentimentele negative în aplicația dvs. utilizând punctul final al modelului de încorporare OpenAI.
- Creați pluginuri de completare a codului specifice limbajului de programare pentru editorii de cod și mediile de dezvoltare integrate (IDE).
Construiți la nesfârșit cu API-urile OpenAI
Comunicarea noastră zilnică implică adesea schimbul de conținut scris. API-ul OpenAI își extinde doar tendințele creative și potențialul, cu cazuri de utilizare a limbajului natural aparent nelimitate.
Este încă devreme pentru API-ul OpenAI. Dar așteptați-vă să evolueze cu mai multe funcții pe măsură ce trece timpul.