Doriți să furnizați ChatGPT datele dvs. personalizate? Iată un pas cu pas despre cum să faci exact asta!

Oferind tehnologia GPT într-un chatbot puternic și ușor de utilizat, ChatGPT a devenit cel mai popular instrument AI din lume. Mulți oameni folosesc ChatGPT pentru a oferi conversații captivante, pentru a răspunde la întrebări, pentru a oferi sugestii creative și pentru a ajuta la codificare și scriere. Cu toate acestea, ChatGPT este limitat, deoarece nu vă puteți stoca datele pentru uz personal pe termen lung și punctul său de limitare a datelor din septembrie 2021.

Ca o soluție, putem folosi API-ul OpenAI și LangChain pentru a oferi ChatGPT date personalizate și informații actualizate după 2021 pentru a crea o instanță ChatGPT personalizată.

De ce să oferi ChatGPT date personalizate?

Alimentarea ChatGPT cu date personalizate și furnizarea de informații actualizate dincolo de data limită a cunoștințelor oferă mai multe beneficii față de utilizarea ChatGPT ca de obicei. Iată câteva dintre ele:

instagram viewer
  • Interacțiuni personalizate: Oferind ChatGPT date personalizate, utilizatorii pot crea o experiență mai personalizată. Modelul poate fi instruit pe seturi de date specifice relevante pentru utilizatorii individuali sau organizații, rezultând răspunsuri adaptate nevoilor și preferințelor unice ale acestora.
  • Expertiza specifică domeniului: Integrarea personalizată a datelor permite ChatGPT să se specializeze în anumite domenii sau industrii. Poate fi instruit pe cunoștințele, terminologia și tendințele specifice industriei, permițând răspunsuri mai precise și mai perspicace în acele domenii specifice.
  • Informații actuale și exacte: Accesul la informații actualizate asigură că ChatGPT rămâne la curent cu cele mai recente evoluții și cunoștințe. Poate oferi răspunsuri precise bazate pe evenimente recente, știri sau cercetări, făcându-l o sursă de informații mai fiabilă.

Acum că înțelegeți importanța furnizării de date personalizate către ChatGPT, iată un pas cu pas despre cum să faceți acest lucru pe computerul dvs. local.

Pasul 1: Instalați și descărcați software-ul și Scriptul prefabricat

Vă rugăm să rețineți că următoarele instrucțiuni sunt pentru o mașină Windows 10 sau Windows 11.

Pentru a furniza date personalizate către ChatGPT, va trebui să instalați și să descărcați cel mai recent Python3, Git, Microsoft C++ și scriptul de recuperare ChatGPT din GitHub. Dacă aveți deja unele dintre programele instalate pe computer, asigurați-vă că sunt actualizate cu cea mai recentă versiune pentru a evita orice sughiț în timpul procesului.

Începeți prin a instala:

  • Descarca:Python3 (Gratuit)
  • Descarca:Git (Gratuit)
  • Descarca:Microsoft Visual Build Tools (Gratuit)

Note de instalare Python3 și Microsoft C++

Când instalați Python3, asigurați-vă că bifați Adăugați python.exe la PATH opțiunea înainte de a da clic Instaleaza acum. Acest lucru este important deoarece vă permite să accesați Python în orice director de pe computer.

Când instalați Microsoft C++, veți dori să instalați Microsoft Visual Studio Build Tools primul. Odată instalat, puteți bifa Dezvoltare desktop cu C++ opțiunea și faceți clic Instalare cu toate instrumentele opționale bifate automat în bara laterală din dreapta.

Acum că ați instalat cele mai recente versiuni de Python3, Git și Microsoft C++, puteți descărca scriptul Python pentru a interoga cu ușurință date locale personalizate.

Descarca: Script de recuperare ChatGPT (Gratuit)

Pentru a descărca scriptul, faceți clic pe Cod, apoi selectați Descărcați ZIP. Acest lucru ar trebui să descarce scriptul Python în directorul implicit sau selectat.

Odată descărcat, acum putem configura un mediu local.

Pasul 2: Configurați mediul local

Pentru a configura mediul, va trebui să deschideți un terminal în folderul chatgpt-retrieval-principal pe care l-ați descărcat. Pentru a face asta, deschide chatgpt-recuperare-principal folder, faceți clic dreapta și selectați Deschideți în Terminal.

Odată ce terminalul este deschis, copiați și lipiți această comandă:

pip install langchain openai chromadb tiktoken nestructurat

Această comandă folosește managerul de pachete Python pentru a creați și gestionați mediul virtual Python Necesar.

După crearea mediului virtual, trebuie să furnizăm o cheie API OpenAI pentru a accesa serviciile lor. Mai întâi va trebui să generăm o cheie API din Site-ul de chei API OpenAI făcând clic pe Creați o nouă cheie secretă, adăugând un nume pentru cheie, apoi apăsând Butonul Creați cheia secretă.

Vi se va furniza un șir de caractere. Aceasta este cheia dvs. API OpenAI. Copiați-l făcând clic pe pictograma de copiere din partea laterală a cheii API. Rețineți că această cheie API trebuie păstrată secretă. Nu-l împărtăși cu alții decât dacă intenționezi cu adevărat ca aceștia să-l folosească cu tine.

Odată copiat, reveniți la folderul chatgpt-retrieval-principal și deschideți constantele cu Blocnotes. Acum înlocuiți substituentul cu cheia dvs. API. Nu uitați să salvați fișierul!

Acum că ați configurat cu succes mediul virtual și ați adăugat cheia API OpenAI ca variabilă de mediu. Acum puteți furniza datele dvs. personalizate către ChatGPT.

Pasul 3: Adăugarea datelor personalizate

Pentru a adăuga date personalizate, plasați toate datele text personalizate în date folder din chatgpt-retrieval-main. Formatul datelor text poate fi sub forma unui PDF, TXT sau DOC.

După cum puteți vedea din captura de ecran de mai sus, am adăugat un fișier text care conține un program personal alcătuit, un articol pe care l-am scris Acceleratoarele de instinct de la AMD, și un document PDF.

Pasul 4: Interogarea ChatGPT prin terminal

Scriptul Python ne permite să interogăm date din datele personalizate pe care le-am adăugat în folderul de date și pe internet. Cu alte cuvinte, veți avea acces la backend-ul obișnuit ChatGPT și la toate datele stocate local în folderul de date.

Pentru a utiliza scriptul, rulați python chatgpt.py script și apoi adăugați întrebarea sau interogarea dvs. ca argument.

piton chatgpt.py "ÎNTREBAREA DUMNEAVOASTRĂ"

Asigurați-vă că puneți întrebările între ghilimele.

Pentru a testa dacă am alimentat cu succes datele noastre ChatGPT, voi pune o întrebare personală cu privire la Personal Sched.txt fişier.

A mers! Aceasta înseamnă că ChatGPT a putut să citească personal Sched.txt furnizat mai devreme. Acum să vedem dacă am alimentat cu succes ChatGPT cu informații pe care nu le cunoaște din cauza datei limită a cunoștințelor.

După cum puteți vedea, a descris corect AMD Instinct MI250x, care a fost lansat după data limită a cunoștințelor ChatGPT -3.

Limitările ChatGPT personalizate

Deși alimentarea GPT-3.5 cu date personalizate deschide mai multe modalități de aplicare și utilizare a LLM, există câteva dezavantaje și limitări.

În primul rând, trebuie să furnizați singur toate datele. Puteți accesa în continuare toate cunoștințele despre GPT-3.5 până la data limită a cunoștințelor; cu toate acestea, trebuie să furnizați toate datele suplimentare. Aceasta înseamnă că dacă doriți ca modelul dvs. local să cunoască un anumit subiect de pe internet pe care GPT-3.5 nu îl cunoaște deja, va trebui să mergeți la internet și să răzuiți singur datele și să le salvați ca text în folderul de date al chatgpt-retrieval-main.

O altă problemă este că interogarea ChatGPT în acest fel durează mai mult timp pentru încărcare în comparație cu solicitarea directă a ChatGPT.

În cele din urmă, singurul model disponibil în prezent este GPT-3.5 Turbo. Deci, chiar dacă aveți acces la GPT-4, nu îl veți putea folosi pentru a vă alimenta instanța personalizată ChatGPT.

ChatGPT personalizat este minunat, dar limitat

Furnizarea de date personalizate către ChatGPT este o modalitate puternică de a profita mai mult de model. Prin această metodă, puteți alimenta modelul cu orice date text doriți și îl puteți solicita la fel ca ChatGPT obișnuit, deși cu unele limitări. Cu toate acestea, acest lucru se va schimba în viitor, deoarece devine mai ușor să integrăm datele noastre cu LLM, împreună cu accesul la cel mai recent model GPT-4.