ChatGPT annuncia Images 2.0 che ora genera e scrive sulle immagini in modo perfetto senza strafalcioni
Per anni uno dei talloni d’Achille dei generatori di immagini basati su intelligenza artificiale è stato la gestione del testo caratteri deformati, parole inventate, tipografia illeggibile. OpenAI ha deciso di chiudere definitivamente questo capitolo con il lancio di ChatGPT Images 2.0.
Infatti la nuova versione del generatore di immagini con intelligenza artificiale è definito dalla stessa azienda un autentico salto di paradigma rispetto a tutto ciò che ha preceduto con immagini più reale e attive nella gestione dei contenuti e dei testi.
Perché il testo era così difficile da generare
I modelli di diffusione, l’architettura dominante nella generazione visiva degli ultimi anni, apprendono i pattern più ricorrenti nei pixel, penalizzando inevitabilmente il testo, che occupa porzioni ridotte dell’immagine complessiva.

Il risultato era sistematicamente insoddisfacente per designer, content creator e sviluppatori. Con Images 2.0, OpenAI risolve il problema alla radice, rendendo possibile la resa di testo piccolo, icone, elementi di interfaccia utente e composizioni visive complesse con una fedeltà prima impensabile.
Le novità principali di ChatGPT Images 2.0
Il nuovo modello supporta una risoluzione massima di 2K, aspect ratio da 3:1 a 1:3 (ideali per banner, poster e storie social) e la generazione di fino a otto output distinti da un unico prompt, con coerenza stilistica garantita tra tutti i risultati.
Per chi lavora su campagne visual, storyboard o serie di grafiche per i social, questo elimina il flusso di lavoro frammentato che costringeva a generare e assemblare le immagini una alla volta, mentre adesso è fatto tutto in un unico comando.
La modalità Thinking: Quando l’AI visiva inizia a ragionare
La novità più rilevante è l’integrazione della modalità Thinking, già nota agli utenti dei modelli testuali di OpenAI. Per la prima volta, un generatore visivo è in grado di cercare informazioni sul web in tempo reale, ragionare sulla struttura della scena, produrre varianti e verificare i propri output prima della consegna.
In pratica, il modello “pensa” prima di disegnare. Questa funzione avanzata è riservata agli abbonati ai piani Plus, Pro, Business ed Enterprise, mentre la modalità base Instant è disponibile per tutti, incluso il piano gratuito.
Fedeltà stilistica e coerenza visiva
ChatGPT Images 2.0 mostra progressi significativi anche in termini di fotorealismo, stile cinematografico, manga, pixel art e altri linguaggi visivi. La coerenza tra output multipli, stesso personaggio, stesso oggetto, stesso stile, è uno degli obiettivi dichiarati, risposta diretta alle esigenze di agenzie, redazioni digitali e creator che producono contenuti in serie.
Disponibilità e accesso
Il modello è disponibile da subito in ChatGPT su web, iOS e Android per tutti gli utenti. Gli sviluppatori possono accedervi tramite API con il nome gpt-image-2, con prezzi variabili in base a qualità e risoluzione.







































Lascia un commento
Visualizza commenti