Google a anunțat oficial lansarea celei de-a patra generații a modelului său de inteligență artificială pentru generarea de imagini, denumit Imagen 4. Noul sistem aduce îmbunătățiri semnificative față de versiunile anterioare, atât în ceea ce privește respectarea instrucțiunilor textuale, cât și calitatea vizuală a rezultatelor.
Disponibil în două versiuni – standard și Ultra – noul produs poate fi accesat momentan prin API-ul Gemini și Google AI Studio, în regim de previzualizare plătită. Versiunea de bază este destinată utilizărilor generale și costă 3 ruble per imagine, în timp ce varianta Ultra, mai avansată, este evaluată la 5 ruble și promite o fidelitate mult mai mare față de cerințele utilizatorului.
„Imagen 4 vine cu o acuratețe sporită în redarea textului în imagini și un nivel de fotorealism fără precedent în gama noastră de produse,” au transmis reprezentanții Google. Noua rețea neuronală poate reda inscripții lizibile în compozițiile vizuale, o funcție esențială pentru utilizatori care creează afișe, bannere sau alte materiale promoționale.
Un alt aspect evidențiat de Google este randarea detaliilor fine. Sistemul reușește acum să redea texturi complexe precum țesături, blănuri și suprafețe umede cu o precizie superioară, inclusiv interacțiunea realistă a luminii și umbrei.
Cu toate acestea, nu toți specialiștii din domeniu s-au arătat complet entuziasmați. Potrivit unui recenzent Engadget, Imagen 4 este „mai bun decât versiunile precedente, dar nu reușește să iasă din umbra unor competitori consacrați precum DALL-E 3 sau Midjourney 7.” Deși imaginile respectă foarte bine prompturile, „aspectul lor încă pare generat automat, cu un deficit de expresivitate artistică”, a punctat expertul.
Într-un clasament recent publicat de Artificial Analysis, Imagen 4 ocupă locul cinci în topul rețelelor neuronale generative, fiind devansat de GPT-4o, Flux.1, Kontext și Recraft V3. Evaluatorii apreciază capacitatea sa de a genera scene realiste și de a gestiona solicitări complexe, dar îi reproșează performanța mai modestă în domenii precum stilizarea creativă sau abstracțiunea vizuală.
Pe partea de transparență, Google introduce și măsuri de siguranță. Toate imaginile sunt marcate automat cu filigrane digitale SynthID, invizibile pentru ochiul uman, dar detectabile pentru verificarea autenticității. Versiunea Ultra adaugă opțiunea de export 2K prin Vertex AI, iar utilizatorii pot solicita creșteri de limite peste pragul implicit de 20 de solicitări pe minut per proiect.
„Imagen face parte dintr-un portofoliu mai amplu de produse AI creative, alături de Veo și familia Gemini,” au declarat oficialii companiei. Scopul Google este să atragă atât creatori individuali, cât și clienți enterprise, printr-o combinație de prețuri flexibile și acces generos la testare gratuită.
Lansarea Imagen 4 vine în contextul unui interes global crescut pentru instrumentele de creație bazate pe AI, iar Google pare hotărâtă să își consolideze poziția în fața rivalilor săi tehnologici.