Creare una fotografia senza il fotografo, la sfida di NVIDIA.

Il produttore di GPU NVIDIA ha compiuto un ulteriore passo avanti nel progetto di utilizzare l’intelligenza artificiale e l’apprendimento automatico per generare immagini fotorealistiche. Descritto come “pennello intelligente”, i ricercatori hanno creato uno strumento in grado di realizzare schizzi di base e trasformarli in immagini di paesaggio fotorealistiche.

La tecnologia si basa su una Generative Adversarial Network (GAN), soprannominata GauGAN in omaggio al pittore post-impressionista Paul Gauguin. La rete è stata addestrata su un milione di immagini per imparare a compilare dettagli fotorealistici basati solamente su tonalità di colore ed etichette di testo.

“È come un’immagine di un libro da colorare che descrive dove si trova un albero, dove si trova il sole, dove si trova il cielo”, ha dichiarato Bryan Catanzaro, vicepresidente della Applied Research for Deep Learning di NVIDIA, in una conferenza che annuncia la GauGAN. “E poi la rete neurale è in grado di riempire tutti i dettagli e le texture, i riflessi, le ombre e i colori, sulla base di ciò che ha imparato sulle immagini reali”.

Le GAN si sono dimostrate molto efficaci nello sviluppo di modelli di apprendimento con macchine fotografiche. Come spiega NVIDIA, “Le GAN possono produrre risultati convincenti grazie alla loro struttura come coppia di reti che collaborano: un generatore e un discriminatore. Il generatore crea immagini che presenta al discriminatore. Addestrato sulle immagini reali, il discriminatore corregge il generatore, con feedback su ogni singolo pixel, indicando come migliorare il realismo delle immagini sintetiche. Dopo l’addestramento su immagini reali, il discriminatore sa che gli stagni e i laghi reali contengono riflessi – così il generatore impara a creare un’imitazione convincente”.

Una volta che GauGAN produce un’immagine, l’utente può ancora manipolarla cambiando ad esempio il giorno con la notte o aggiungendo un filtro di stile che dà all’immagine l’aspetto di un dato stile pittorico, così come siamo già stati abituati da innumerevoli app per smartphone tipo Prism.

Al momento, GauGAN esiste sia come demo che come documento accademico. Nel suo post sul blog che descrive la tecnologia, NVIDIA vede il suo target di riferimento come “architetti e urbanisti per paesaggisti e sviluppatori di giochi”. Non è difficile immaginare anche altri mercati, come la fotografia di stock, ma in questo senso sarebbe veramente una concorrenza sleale nei confronti di chi si suda le proprie fotografie e giustamente desidera trarne un profitto.

Ancora troppo presto per giudicare se la tecnologia supererà l’arte e la buona volontà di ogni fotografo, probabilmente no, ma di sicuro molte applicazioni non fotografiche potrebbero trarre grandi vantaggi da questa applicazione di NVIDIA.