OpenAI a oferit ChatGPT capacitatea de a vorbi folosind o voce sintetizată și va ajunge în curând pe smartphone-ul tău.

ChatGPT este setat să devină o experiență interactivă generativă AI. OpenAI a dezvăluit că cel mai important chatbot AI din lume va fi capabil să vorbească și să răspundă la întrebările utilizatorilor folosind o voce sintetizată, probabil generată de AI.

Alături de noua sa voce, ChatGPT va putea, de asemenea, să răspundă și să discute despre anumite imagini încărcate pe acesta sau realizate în timp ce folosește aplicația ChatGPT pentru Android sau iOS. Funcția de recunoaștere a imaginii sună similar cu Google Lens și cu alte aplicații care folosesc rețele neuronale pentru a detecta datele și informațiile cu acuratețe.

OpenAI oferă ChatGPT o voce

Pe 25 septembrie 2023, dezvoltator ChatGPT OpenAI a dezvăluit ar oferi o voce chatbot-ului său generativ AI, lider mondial. Utilizatorii ChatGPT pot vorbi direct cu chatbot-ul și pot solicita acestuia să răspundă, permițând efectiv ChatGPT să converse direct cu vocea pentru prima dată.

instagram viewer

Exemplul de clip OpenAI prezintă o femeie care cere ChatGPT să creeze o poveste unică înainte de culcare, la care ChatGPT răspunde în mod corespunzător cu o voce feminină sintetizată.

Conform Cablat, noul model text-to-speech a fost dezvoltat intern. Poate genera sunet „asemănător unui om” din text și câteva secunde de exemplu de vorbire (folosind modelul OpenAI Whisper) și vorbesc în diverse tonuri și stiluri. Puteți găsi o gamă de mostre de voce pe Blogul lui OpenAI.

Unele companii folosesc deja noul model de voce OpenAI. De exemplu, Spotify folosește modelul text-to-speech al OpenAI pentru a traduce podcasturi în diferite limbi, combinând priceperea de traducere a limbilor ChatGPT cu noua sa capacitate de vorbire.

Noul model text-to-speech al ChatGPT este disponibil numai pentru abonații Plus și Enterprise care folosesc oficialul Aplicațiile Android și iOS și este de așteptat să fie lansate în următoarele două săptămâni (începând cu 25 septembrie, 2023). În plus, noua funcție de voce este limitată la engleză pentru început, deși ne-am aștepta ca acest lucru să se schimbe rapid.

ChatGPT poate recunoaște și analiza imagini și fotografii

A doua parte a actualizării ChatGPT de la OpenAI este capacitatea de a analiza și vorbi imaginile încărcate în instrument. Opțiunea de analiză vizuală a imaginii a fost prezentată în videoclipurile de actualizare GPT-4, dar nu a mai fost discutată prea mult de atunci (Interpretul de cod ChatGPT deoparte).

Acum, ChatGPT câștigă funcționalități similare cu Google Lens. Puteți încărca o imagine în ChatGPT sau puteți face o fotografie folosind camera smartphone-ului în aplicația ChatGPT și va detalia imaginea, adăugând mai mult context acolo unde este necesar.

Numirea lui „similar cu Google Lens” face o nedreptate, într-adevăr. Abilitatea de a discuta înainte și înapoi despre imagine pentru a obține mai multe informații și context o face extrem de utilă pentru o gamă largă de setări. Cu toate acestea, este important să rețineți că literele mici, OpenAI clarificând că a limitat „capacitatea ChatGPT de a analiza și de a face declarații directe despre oameni” din motive de confidențialitate și acuratețe. Totuși, ar putea un instrument „Cine este acesta” alimentat de OpenAI să fie în lucru pentru viitor? (Să sperăm că nu!)

La fel ca noul model text-to-speech, OpenAI va lansa recunoașterea imaginilor în următoarele două săptămâni, deși va fi disponibil pe toate platformele, nu doar pe aplicația ChatGPT.

Confidențialitate, securitate și alte probleme

Implicațiile unui ChatGPT cu voce sunt grave. Sigur, este incitant. Cu toate acestea, capacitatea de a crea o voce sintetizată în mod unic folosind doar un scurt fragment ca exemplu are probleme considerabile de confidențialitate și securitate. Potențialul actorilor rău intenționați de a exploata aceste instrumente este enorm și, ca și în cazul oricărui instrument generativ de inteligență artificială, odată ce geniul iese din sticlă, nu se va mai întoarce. Nici o cantitate de reglementare AI din partea guvernelor sau a liderilor de gândire nu poate întoarce valul.

Chiar și avertismentul OpenAI pe această temă pare să ocolească ceea ce este evident, în ciuda menționării problemelor:

Cu toate acestea, aceste capabilități prezintă, de asemenea, noi riscuri, cum ar fi potențialul actorilor rău intenționați de a uzurpa identitatea unor personalități publice sau de a comite fraude. Acesta este motivul pentru care folosim această tehnologie pentru a alimenta un anumit caz de utilizare - chatul vocal.

Având în vedere că acesta este vârful aisbergului, așteptați-vă la refuz împotriva noii voci a lui ChatGPT, mai ales o dată există o creștere previzibilă a titlurilor neplăcute care susțin că ChatGPT este folosit pentru a comite fraude și așadar pe.

OpenAI face din ChatGPT aplicația Go-To AI

Cu cât OpenAI adaugă mai multe funcții ușor de utilizat la ChatGPT, cu atât mai mult devine aplicația AI generativă. Fiind primul care a atins faima pe scară largă în timpul boom-ului generativ inițial al AI, ChatGPT încă conduce drumul și este numai aplicația folosește oarecare, în ciuda concurenței din partea Google Bard (și potențial Google Gemini) și Anthropic Claude.

Atâta timp cât OpenAI poate continua să adauge funcții care fac ChatGPT mai ușor de utilizat, îi va ține pe oameni captivați și va împinge din ce în ce mai aproape de obiectivul său de un instrument AI cu adevărat multimodal.