Nano-banana è il generatore di immagini Google che prova a sostituirsi a Photoshop

Google ha annunciato il lancio di Gemini 2.5 Flash Image (nome in codice nano-banana), il suo modello più avanzato per la generazione e l’editing di immagini basato sull’intelligenza artificiale. Si tratta di un aggiornamento importante rispetto alla versione precedente (Gemini 2.0 Flash), che già aveva convinto sviluppatori e aziende grazie a latenza ridotta, costi contenuti e semplicità d’uso. Con questa nuova release, Google intende offrire immagini di qualità superiore e un controllo creativo molto più raffinato.
Disponibile fin da subito tramite Gemini API, Google AI Studio e, per le imprese, su Vertex AI, Gemini 2.5 Flash Image si propone come uno strumento versatile per professionisti e sviluppatori. Il modello ha un prezzo di 30 dollari per 1 milione di token in output, con un costo medio di circa 0,039 dollari per immagine.
Il salto in avanti di Gemini 2.5 Flash Image risponde direttamente al feedback degli utenti: se la prima versione era apprezzata per efficienza e velocità, molti chiedevano maggiore qualità visiva e strumenti di editing più avanzati. Con questo aggiornamento, Google ha introdotto quattro aree chiave di innovazione: consistenza dei personaggi, editing mirato basato su prompt, conoscenza del mondo reale e fusione multi-immagine.
Consistenza dei personaggi: storytelling senza interruzioni
Uno dei problemi più complessi nell’immagine generativa riguarda il mantenimento della consistenza visiva di un personaggio o oggetto attraverso più prompt ed elaborazioni. Con Gemini 2.5 Flash Image, è ora possibile collocare lo stesso personaggio in ambienti differenti, mostrare un prodotto da più angolazioni o generare asset di brand uniformi senza alterazioni indesiderate.
Google ha creato un’app dimostrativa all’interno di AI Studio che mostra come la nuova tecnologia riesca a mantenere identità e caratteristiche di un soggetto in una serie di immagini diverse. Un vantaggio evidente non solo per lo storytelling visivo, ma anche per il marketing e la produzione di contenuti aziendali.
Editing mirato con prompt naturali
Un’altra novità fondamentale è la possibilità di eseguire modifiche locali e trasformazioni mirate tramite linguaggio naturale. Con un semplice prompt è possibile sfocare lo sfondo di una foto, rimuovere un oggetto o una persona, correggere dettagli come una macchia su un indumento, modificare la posa di un soggetto o persino colorare un’immagine in bianco e nero.
Conoscenza del mondo reale
Un altro aspetto interessante di Gemini 2.5 Flash Image è l’integrazione della conoscenza semantica del mondo reale, che amplia notevolmente le possibilità di utilizzo. Non si tratta più soltanto di generare immagini dall’aspetto estetico gradevole, ma di interpretare contenuti e contesti complessi.
Un’app demo di Google AI Studio mostra come il modello riesca a leggere e comprendere diagrammi disegnati a mano, rispondere a domande pratiche e seguire istruzioni di editing articolate in un unico passaggio. Questo approccio apre scenari nell’educazione interattiva, nella formazione e nella creazione di strumenti didattici intelligenti.
Fusione multi-immagine
La nuova funzionalità di multi-image fusion consente al modello di comprendere e combinare più immagini in input. Con un unico prompt, è quindi possibile inserire un oggetto in una scena, ridisegnare un ambiente con una nuova palette cromatica o fondere elementi diversi in un’unica immagine coerente.
Google ha mostrato un’app in AI Studio che permette di trascinare prodotti in un nuovo contesto e ottenere immediatamente un’immagine fotorealistica. Questa capacità ha applicazioni evidenti nell’e-commerce, nell’arredamento e nel design, dove la possibilità di creare mockup rapidi e realistici è un grande vantaggio competitivo.
Strumenti per sviluppatori e community
Per facilitare l’adozione del modello, Google ha aggiornato la “build mode” di AI Studio, semplificando il processo di creazione di app basate su Gemini. Con pochi passaggi è possibile testare il modello, remixare applicazioni preimpostate o generare nuove idee partendo da un singolo prompt. Una volta pronta, l’app può essere distribuita direttamente da AI Studio o salvata su GitHub.
Tutte le immagini prodotte o modificate con Gemini 2.5 Flash Image includeranno un watermark digitale invisibile SynthID, sviluppato da Google DeepMind. Questo contrassegno consente di identificare i contenuti generati dall’AI, garantendo maggiore trasparenza e riducendo il rischio di utilizzi impropri.
Gemini 2.5 Flash Image è già disponibile in anteprima tramite Gemini API e AI Studio, mentre la versione stabile arriverà nelle prossime settimane.