Să punem cei mai mari jucători de artă AI unul împotriva celuilalt și să vedem care iese în top. DALL-E, Midjourney sau Stable Diffusion?
Inteligența artificială a parcurs un drum lung în domeniul generării de imagini. Aplicațiile generative precum DALL-E, Midjourney și Stable Diffusion au avut un efect profund asupra modului în care interacționăm cu conținutul digital.
În acest articol, vom compara fiecare aplicație pentru a vedea care este mai bună în general la generarea de imagini pe baza solicitărilor de text. Să începem!
DALL-E 2
DALL-E 2 are o interfață simplă, ușor de înțeles și este ușor să începeți să generați imagini fără a fi nevoie să vă înscrieți la o platformă terță parte. Doar accesați site-ul web și introduceți textul dvs. în Genera caseta pentru a crea o imagine. DALL-E 2 va produce apoi patru versiuni ale promptului, pe care le puteți edita sau descărca.
Caracteristica remarcabilă
O caracteristică remarcabilă a DALL-E 2 este capacitatea de a crea, edita și combina mai multe imagini. După ce selectați imaginea dorită și faceți clic
Editați | ×, veți avea posibilitatea de a utiliza Adăugați cadru de generație caracteristică pentru a adăuga generații de imagini suplimentare la cea existentă.Odată ce plasați cadrul, introduceți o nouă solicitare și DALL-E 2 va genera un nou set de imagini cu opțiunea de a fuziona oricare dintre ele în imaginea originală.
Apoi puteți utiliza oricare dintre funcțiile de editare pentru a crea imaginea la perfecțiune. De exemplu, puteți utiliza Şterge instrument pentru a șterge pixelii existenți și apoi introduceți text nou în caseta Generare pentru a-l completa. Puteți face acest lucru de mai multe ori pentru a obține rezultatele dorite.
Dar rețineți că de fiecare dată când faceți clic pe Generare, utilizați credite. Și odată ce alocarea dvs. este utilizată, va trebui să achiziționați mai multe credite pentru a continua.
Pro
- Ușor de folosit
- Multă flexibilitate creativă
- Nu este necesară nicio platformă terță parte
Contra
- Imagini simpliste
- Nu este un grad ridicat de precizie
- Se pot crea doar imagini pătrate
Acoperim elementele de bază ale DALL-E 2 dacă nu l-ai mai folosit niciodată.
Mijlocul călătoriei
Mijlocul călătoriei este fără îndoială generatorul AI text-to-image de batut. Cu setul său puternic de caracteristici, este capabil să producă imagini extrem de artistice și credibile pe care alți concurenți AI nu le-au realizat în mod constant. Dar, spre deosebire de DALL-E 2, trebuie să creați un cont Discord înainte de a începe să îl utilizați.
Chiar și cu straturile adăugate de complexitate și în ciuda faptului că trebuie să tastați comenzi precum /imagine pentru a-ți genera imaginile, vei ierta în curând Midjourney din cauza artei frumoase pe care o poți crea cu câteva cuvinte.
Ca și în cazul DALL-E 2, sunt create patru versiuni și puteți selecta una sau mai multe dintre ele pentru a descărca sau a crea variante. Dar există mai multă flexibilitate cu rapoartele de imagine; puteți face orice raport pe care îl preferați, adăugând fiecare imagine cu care --ar și apoi urmată de raportul, în exemplul nostru, 3:2.
Calitatea rezultatelor este o magie inconfundabilă Midjourney.
Caracteristica remarcabilă
Una dintre cele mai interesante și mai puternice caracteristici ale Midjourney este capacitatea de a vă încărca propriile imagini și apoi de a-i cere Midjourney să creeze solicitări pentru ele pe care le puteți utiliza pentru a crea imagini complet noi. Tastând /describe, vi se cere să încărcați una dintre imaginile dvs.
Odată încărcat, Midjourney va oferi patru solicitări cu propria sa interpretare a ceea ce vede.
Puteți utiliza apoi aceste solicitări pentru a crea un set complet diferit de imagini.
Cu atât de multă flexibilitate creativă, Midjourney oferă posibilități aproape nesfârșite.
Pro
- Imagini de înaltă calitate
- Utilizatorii pot programa rapoarte personalizate
- Multă flexibilitate pentru a controla parametrii imaginii
Contra
- Mai complicat de folosit
- Necesită utilizatorilor să se înregistreze la Discord
- Timpul de generare a imaginii crește dramatic după ce orele rapide sunt epuizate
Puteți creați fundaluri uimitoare pentru portrete folosind Midjourney pentru a-ți scoate fotografiile în evidență.
Difuzie stabilă
Stable Diffusion reprezintă Vestul Sălbatic al aplicațiilor AI generative. Cu multe aplicații bazate pe web și opțiuni de instalare disponibile, nu este ușor să compari Stable Diffusion cu DALL-E 2 și Midjourney. Acest lucru se datorează în mare parte disparității dintre versiunile web și modelele de instalare în ceea ce privește opțiunile și calitatea ieșirii. Cu alte cuvinte, versiunile Stable Diffusion instalate vă vor oferi în general rezultate mult mai bune și libertate creativă.
Ne vom uita pe site-ul oficial Stable Diffusion, DreamStudio de Stability AIși vă arată cum să începeți să utilizați aplicația pentru a vă oferi o idee de bază despre abilitățile acesteia.
Aspectul Stable Diffusion în DreamStudio este mai aglomerat decât DALL-E 2 și Midjourney, dar este totuși ușor de utilizat. Utilizatorii de probă primesc 200 de credite gratuite pentru a crea solicitări, care sunt introduse în Prompt cutie. Dar, în plus, există și un Solicitare negativă casetă în care puteți preveni Stable Diffusion pentru a lăsa lucrurile afară.
Există câteva alte caracteristici esențiale în meniul din stânga de luat în considerare, care vor afecta imaginea generală și utilizarea creditului. Există o Stil caseta de optiuni, Incarca imaginea, și Setări (pentru raport și numărul de imagini de generat). În Avansat filă, există Forța promptă, Etapele generației, Sămânță, și Model.
Când treceți cu mouse-ul peste fiecare dintre aceste opțiuni, există o scurtă descriere a fiecărei caracteristici. Dar pentru a înțelege cu adevărat ce face fiecare dintre ele în practică, trebuie doar să le încercați. Dar fii atent la creditele tale, deoarece acesta nu este un sistem de un credit pentru o imagine.
Caracteristica remarcabilă
The Solicitare negativă este probabil caracteristica remarcabilă a Stable Diffusion de la DreamStudio. De asemenea, se presupune că este un instrument extraordinar în alte versiuni de Stable Diffusion, care ajută la calitatea generală a imaginii. În acele versiuni, tastarea afirmațiilor negative ajută algoritmii să producă imagini mai precise și de calitate superioară.
Când mesajele negative funcționează, funcționează bine. Dar veți cheltui credite încercând să perfecționați aspectul pe care îl doriți în multe cazuri.
Pro
- Opțiuni multiple pentru versiuni web și instalate
- Mai multă libertate creativă (puteți crea imagini necenzurate pe unele versiuni)
- O mulțime de comenzi pentru a personaliza parametrii imaginii
Contra
- Arde prin credite în versiuni plătite
- Curbă abruptă de învățare
- Calitatea imaginii este foarte greșită, în funcție de versiunea pe care o aveți
Dacă aveți nevoie de ajutor pentru a crea solicitări, vă arătăm cum să utilizați ChatGPT pentru a crea imagini AI.
Care este aplicația mai bună?
Deci, care este cea mai bună aplicație, DALL-E 2, Midjourney sau Stable Diffusion? Este o întrebare dificilă, deoarece utilizatorii vor avea așteptări diferite și există versiuni diferite ale acestor aplicații care fac comparațiile directe nerealiste. Cu toate acestea, putem evalua fiecare dintre exemplele noastre după aceste categorii.
Clasamentul calității imaginii
Midjourney a produs imagini de cea mai bună calitate în exemplele noastre. Erau mai realiste și mai frumos redate decât DALL-E 2 și Stable Diffusion.
Ușurință în utilizare
Din cutie, DALL-E 2 a fost cel mai ușor de utilizat. Nu a fost nevoie de o aplicație terță parte, iar meniul a fost simplu și simplificat.
Caracteristici și capacități
Midjourney îi depășește pe concurenții săi, deoarece are mai multe caracteristici și capacități care produc imagini de înaltă calitate mai constant.
Viteză
DALL-E 2 produce imagini cel mai rapid (aproximativ 12 secunde), depășind Stable Diffusion cu aproximativ o secundă și Midjourney (în modul Fast) cu o marjă mai mare.
Flexibilitate și personalizare
Stable Diffusion este într-o clasă proprie pentru flexibilitate și personalizare. Există un număr tot mai mare de versiuni care permit utilizatorilor nu numai să creeze imagini care sunt de obicei cenzurate, ci dar există versiuni care chiar produc imagini de înaltă calitate care sunt modelate direct din Midjourney imagini.
Midjourney și DALL-E 2 sunt pe primul loc în numărul de categorii câștigate, dar câștigătorul general ar trebui să meargă la Midjourney, doar pe baza calității imaginii.
Pe măsură ce concurența se intensifică, utilizatorii de conținut AI sunt mai bine serviți
Cel mai mult pe care îl putem oferi este un instantaneu al celor mai performanti dintre DALL-E 2, Midjourney și Stable Diffusion, la un moment dat. Domeniul tehnologiei inteligenței artificiale este în continuă evoluție, numeroși concurenți intră pe piață în fiecare zi. Acest lucru este extrem de benefic pentru utilizatorii de aplicații AI generative, deoarece încurajează inovația și duce la costuri reduse pentru ca noi toți să accesăm aceste instrumente creative incredibile.