Tu scrivi, Google disegna. Aperitivo con Imagen

Teresa Scarale
Teresa Scarale
14.11.2022
Tempo di lettura: 1'
Si chiama Imagen: è l’applicativo di intelligenza artificiale in fase di test “culinario” sul motore di ricerca più noto

Immaginare le cose più bizzarre, e vedersele comparire in forma di immagine, senza necessità di fare ricerca alcuna sugli stock di foto. È l’ambizione di Google, che con Imagen, il suo applicativo di intelligenza artificiale, sta sviluppando questa funzionalità.

Imagen, un test “in cucina” da Google

La risposta di Google all'ondata di modelli text-to-image come quelli rilasciati da Meta, Microsoft e OpenAI è cauta: il colosso di Internet offre agli utenti un assaggio della app all'interno della sua “AI Test Kitchen”, la “cucina per i test sull’intelligenza artificiale”. Come gli altri applicativi (DALL-E – algoritmo di intelligenza artificiale di OpenAI; Make-A-Scene – Meta; Stable Diffusion), Imagen utilizza tecnologie di imaging dell'IA per trasformare brevi descrizioni testuali in immagini. AI Test Kitchen offre agli utenti due strumenti di test, giocosi: City Dreamer e Wobble.

Per accedervi, l'applicazione, richiede che si risponda a una breve domanda; poi, si è messi in una lista d'attesa. Gli utenti sono molto attivi. In City Dreamer, gli utenti propongono un tema e il modello crea edifici e aree urbane.

 


 

Per Wobble, gli utenti scelgono un materiale e dei capi di abbigliamento, e il modello genera un mini-mostro (che balla se viene punzecchiato).

 

 

Rispetto agli altri modelli, la libertà creativa dei testatori è intenzionalmente più limitata: Google vuole raccogliere il maggior numero possibile di riscontri e segnalazioni di malfunzionamento prima di lanciare la versione completa del prodotto.

La società vorrebbe evitare che si presentassero nell’utilizzo di Imagen gli stessi problemi riscontrati negli altri applicativi text to image, quelli relativi ai pregiudizi sociali insiti nella stesura dei testi. «C'è il rischio che Imagen abbia codificato stereotipi e rappresentazioni dannose», hanno fatto sapere dal team Brain di Google Research, «ciò guida la nostra decisione di non rilasciare Imagen al pubblico senza ulteriori garanzie».

Il rapido emergere di questo tipo di immagini ha sollevato anche preoccupazioni sul copyright artistico. I modelli text-to-image fanno generalmente uso di tutte le immagini disponibili pubblicamente, senza accreditare o compensarne i creatori. Nel settembre 2022 Getty Images ha bandito queste immagini dalla sua piattaforma, mentre in ottobre Shutterstock ha stretto un accordo con OpenAI al fine di integrare un prodotto di sintesi delle immagini nel suo servizio.

Caporedattore Pleasure Asset. Giornalista professionista, garganica, è laureata in Discipline Economiche e Sociali presso l'Università Bocconi di Milano. Scrive di finanza, economia, mercati dell'arte e del lusso. In We Wealth dalla sua fondazione

Cosa vorresti fare?

X
I Cookies aiutano a migliorare l'esperienza sul sito.
Utilizzando il nostro sito, accetti le condizioni.
Consenti