Creatività artificiale: un dibattito più aperto che mai

Vanni Santoni, opera di arte digitale, creatività digitale

Il commento che si sente ripetere più spesso quando si prova ad intraprendere una discussione sul tempo presente, almeno a partire dal 2020, è «sembra di vivere in un racconto di fantascienza». E, solitamente, in questi casi si intende una distopia.

È anche la sensazione che tanti hanno provato quando, verso la fine del 2022, le loro bacheche social hanno iniziato a svuotarsi delle fotografie sorridenti dei loro contatti, per essere rimpiazzati da avatar digitali. Si tratta di immagini generate da intelligenze artificiali come Lensa AI che, a fronte di una spesa di pochi euro (e di un gran numero di immagini con cui “nutrire” il suo algoritmo), danno a chiunque la possibilità di produrre un’illustrazione di altissima qualità che, se richiesta ad un artista umano, avrebbe necessitato di diverse ore di lavoro e di un’ingente commissione. Si trattava però solo della punta dell’iceberg, cioè della manifestazione più mainstream delle nuove possibilità aperte dalla tecnologia che entro pochi anni sono destinate a cambiare completamente il nostro modo di fare e comprendere le immagini e, di conseguenza, la storia dell’arte.

Un’app come Lensa funziona grazie ad un tipo di intelligenza artificiale che viene definita ITI (Image To Image). Partendo da input visuali, queste AI (Artificial Intelligence) restituiscono un output visuale. Fornendo all’AI dai 10 ai 20 selfie, questa “apprende” ed è in grado di riprodurre la mia fisionomia, anche in pose e contesti inediti. Allo stesso modo, grazie ad un vasto database di opere di artisti ed illustratori, Lensa riproduce stili di disegno che permettono all’output finale di farmi apparire nelle vesti del protagonista di un manga o di una space opera, come il soggetto di un dipinto impressionista o come l’eroe sulla copertina di una rivista Marvel.

I risultati di app come Lensa sono sorprendenti per la qualità del risultato a fronte di un così piccolo sforzo umano, ma sono ancora lontanissimi dal potere dirompente di un altro tipo di tecnologia: le AI TTI (Text To Image). Quasi contemporaneamente agli avatar di Lensa AI hanno iniziato a circolare sui social immagini che sembravano emerse direttamente dall’inconscio di grandi autori della storia dell’arte, dal Rinascimento alle avanguardie artistiche del Novecento. Solo ad un’attenta analisi è possibile rendersi conto che queste immagini non sono frutto della creazione di un artista contemporaneo particolarmente visionario: piccoli dettagli incoerenti (la maggior parte delle AI ha ancora problemi nella ricostruzione di dita e occhi) e, soprattutto, per il testo che accompagna l’immagine e che dichiara l’impiego delle ultime versioni di AI TTI come Midjourney o Dall-e.

Opera digitale, prompter Giovanni Luca Molinari
Opera digitale realizzata con AI, prompter Giovanni Luca Molinari

Le AI Text To Image, come intuibile dal nome stesso, ricevono come input un testo (in gergo tecnico un “prompt”) e restituiscono come output una serie di immagini. Nel concreto, i/le “prompter”, così sono chiamate le persone che sfruttano le AI TTI per generare immagini, scrivono quindi un testo originale, vicino al linguaggio umano ma con una serie di indicazioni a stili/effetti/autori specifici a cui desiderano che il risultato finale si avvicini. L’AI attinge al suo sterminato database per generare una serie di immagini coerente (secondo i suoi parametri) con la richiesta. A questo punto, secondo modalità differenti in base al funzionamento delle diverse AI, il/la prompter ha la possibilità di elaborare ulteriormente una o più di queste immagini fino ad ottenere un risultato soddisfacente.

Come spesso accade, il cambiamento ci coglie di sorpresa, anche quando arriva annunciato da tempo. Quasi 4 anni fa ormai parlavamo dei primi risultati delle aspirazioni creative delle Intelligenze Artificiali, una possibilità che Asimov aveva teorizzato oltre mezzo secolo fa. Guardavamo con stupore e un pizzico di ironia alle immagini prodotte da AI ormai antiquate come Deep Dream, in cui era ancora possibile distinguere chiaramente la filigrana degli infiniti livelli di immagini rielaborate dall’algoritmo e fuse insieme in chimere mostruose. Ci interrogavamo sulla possibilità di parlare di creatività artificiale e su scenari futuribili lontanissimi… Meno di quattro anni dopo eccoci qui, proiettati nel futuro prima del previsto. E questo è solo l’inizio, perché AI in grado di comporre musica o scrivere testi indistinguibili dai prodotti umani sono già realtà e presto faranno la loro comparsa sul mercato.

Basta guardare alcune delle immagini realizzate grazie a questa tecnologia per immaginare il terremoto che si è scatenato nel mondo dell’arte, e non solo. Le ultime versioni di Midjourney e Dall-e, proprio in virtù dell’alta qualità dei risultati e della loro facilità di utilizzo, sollevano tutta una serie di problemi che cerchiamo di riassumere di seguito. Il dibattito è aperto e per un approfondimento sui diversi punti di vista consigliamo la lettura degli articoli di alcuni degli autori più attivi intorno questo tema come Lorenzo Ceccotti, Francesco D’Isa e Vanni Santoni (gli ultimi due sono anche abili prompter e alcune delle immagini presenti in questo articolo sono frutto delle loro sperimentazioni con le AI TTI).

Le immagini generate dalle intelligenze artificiali hanno valore artistico?

Opera digitale, propmpter Vanni Santoni
Opera digitale, propmpter Vanni Santoni

Sul piano teorico, questa domanda è molto interessante. Da una parte viene molto facile citare Baudelaire e le sue perplessità ottocentesche riguardo alle pretese artistiche del nuovo strumento del suo tempo per la creazione di immagini: la fotografia.

Se si concede alla fotografia di sostituire l’arte in qualcuna delle sue funzioni, essa presto la soppianterà o la corromperà del tutto, grazie alla alleanza naturale che troverà nell’idiozia della moltitudine

C’è chi vede nelle AI TTI solo un nuovo mezzo espressivo nell’arsenale dell’artista che, al pari di ogni altro strumento (dalla cinepresa al pennello), non è neutro. Dall’altra parte, chiunque abbia fatto anche solo un esperimento con Dall-e e Midjourney sa bene che è ben diverso dall’utilizzare un pennello, e anche dallo schiacciare il pulsante di una macchina fotografica. Il prompter non ha la minima possibilità di prevedere quale immagine l’AI genererà a partire dal suo testo, per quanto dettagliato possa essere. Questo fattore di imprevedibilità è molto più radicale di quanto si potrebbe immaginare, non ha infatti a che fare con il problema del non conoscere il funzionamento della tecnologia che si sta utilizzando o il database di riferimento, ma con il funzionamento completamente differente della cosiddetta “intelligenza artificiale” rispetto all’intelligenza umana. Come dimostrano i miei scarsi primi tentativi, ottenere immagini soddisfacenti richiede esercizio per comprendere lo strumento e, probabilmente, anche una certa dose di talento.

Lo scarto tra attese e risultato è anche uno degli espetti più interessanti della relazione tra prompter e AI, che prende la forma, a seconda dell’approccio del prompter, di un vero e proprio sforzo agonistico per piegare l’AI ai propri desideri, di un dialogo, o di un gioco. Generare immagini attraverso una AI TTI ricorda l’attività di uno psiconauta che si immerge nell’immaginario collettivo per trarne immagini oniriche.

E qui si apre un altro grande tema, perché proprio addentrandoci nei territori del subconscio ci accorgiamo di come anche questo sia culturalmente determinato. Per funzionare un’AI TTI necessita di milioni di immagini di artisti umani, di cui replicherà tutti gli stereotipi ed i bias cognitivi. Se si chiede a Midjourney di creare le immagini di un Mamma ho riperso l’aereo, ma ambientato nella Russia negli anni Ottanta, come ha fatto questa pagina meme, il risultato è proprio come ce lo potremmo immaginare: un bambino biondo povero ed emaciato che corre davanti a immensi casermoni grigi in un’atmosfera cupa e desolata. In questo caso le immagini sullo schermo risuonano con la nostra immagine mentale, non tanto da un punto di vista formale, ma per “l’estetica” che noi (occidentali) attribuiamo ad un certo contesto storico. A meno che non venga diversamente specificato, è molto probabile che le figure umane protagoniste delle immagini generate dalle AI siano bianche, belle e abili. A questo si aggiunge poi il sistema di censura attivamente messo in atto da Midjourney e da altre AI, che impediscono la creazioni di immagini “problematiche”, che vadano cioè a toccare la sensibilità di alcune fasce della popolazione (il nudo è un tabù, solo per fare un esempio).

Mamma ho perso l'aereo, in versione russa
Mamma ho perso l’aereo, in versione russa

Sul fatto che un bravo prompter debba essere considerato alla stregua di un artista, di un curatore di immagini o di un semplice tecnico ognuno può farsi la sua opinione: l’importante è capire come funziona nello specifico questa nuova tecnologia e quali similitudini o differenze ci sono rispetto a quelle che l’hanno preceduta. Probabilmente non si può dare una risposta univoca alla domanda in quanto più che dall’immagine in sé il valore artistico di un’immagine dipende dal contesto all’interno della quale è inserita. Numerosi artisti contemporanei impiegano già da tempo le AI all’interno dei loro lavori, a volte sfruttando proprio i loro difetti tecnici che possono portare a risultati inaspettati (l’artista Hito Steyerl parla di “Idiozia digitale”). Molte delle immagini generate dalle AI fino a pochi mesi fa ci proiettavano direttamente nel territorio della Uncanny Valley, e questa qualità di perturbare ed intrigare lo spettatore era spesso voluta e ricercata. Le AI di oggi però sono sempre più abili nell’ingannarci e di fatto tante delle immagini che già circolano sul web sono prodotte da intelligenze artificiali non dichiarate, a volte ritoccate poi dalla mano umana.

Citando Dino Formaggio: «L’arte è tutto ciò che gli uomini chiamano arte». Sarà quindi la pratica a dirci se le immagini generate dalle AI potranno essere considerate opere d’arte (o meglio, se le persone che fanno parte del mondo dell’arte vorranno considerarle tali). Di importanza molto più immediata è provare a comprendere l’impatto che questa tecnologia avrà sull’industria culturale, e non solo, nei prossimi anni, soprattutto a fronte degli ulteriori passi avanti che le AI sono destinate a compiere su quello che ormai sappiamo essere il brevissimo periodo.

Come sempre accade quando un nuovo medium fa la sua comparsa sulla scena, il dibattito attorno a questo tema si può riassumere nei poli opposti che vedono scontrarsi la posizione degli “apocalittici” (un uso sregolato della nuova tecnologia spazzerà via l’industria culturale per come la conosciamo oggi) e quella degli “integrati” (la nuova tecnologia troverà spazio in una nuova nicchia specifica e l’industria culturale continuerà a sopravvivere, dopo qualche assestamento). Il problema è proprio provare ad immaginare cosa comporteranno nel concreto queste “scosse di assestamento”.

Innanzitutto c’è un tema legale. Numerosi artisti hanno protestato nel momento si sono resi conto che alcune immagini postate sul web erano state utilizzate senza il loro consenso per nutrire gli algoritmi di AI TTI a pagamento, come Midjourney. Il problema è estremamente complesso perché le AI per funzionare necessitano di milioni di immagini e tutte concorrono, in un modo o nell’altro, a rendere l’AI più efficiente: nella maggior parte dei casi non è possibile determinare quali immagini siano state “prese a modello” per un determinato output e questo rende quasi impossibile elaborare modelli di remunerazione appropriati.

La soluzione sarebbe quella di pagare ogni artista di cui vengono impiegate le immagini, ovviamente con la possibilità per gli artisti di rifiutare. Tuttavia, cosa succederebbe se un artista umano copiasse un suo collega con uno stile molto interessante solo per “vendere” le sue immagini a una AI? Un’altra soluzione proposta da qualcuno sarebbe quella di valorizzare i lavori umani rispetto a quelli delle AI TTI anche da un punto di vista economico, ad esempio con sgravi fiscali…

Un'immagine realizzata con Deep Mind, una delle prime intelligenze artificiali:
Immagine realizzata con Deep Dream, una delle prime intelligenze artificiali: la filigrana rielaborata dall’algoritmo è chiaramente visibile.

Il dibattito su questo tema prende la forma dello scontro tra uomo e macchina che abbiamo già visto tante altre volte (operai delle fabbriche contro l’automazione, ma anche tassisti contro Uber), ma che fino ad oggi non aveva mai riguardato le professioni cosiddette “creative”. Non sarà tanto il ruolo dell’artista ad essere messo in crisi dall’avvento delle AI, quanto tutte quelle professioni che uniscono allo sforzo tecnico e intellettuale logiche di produzione. Illustratori, visual designer, ma anche “content” nel senso più vasto del termine e traduttori, potranno presto essere figure troppo costose e poco efficienti rispetto alla controparte artificiale.

AI in grado di generare in breve tempo testi complessi partendo da poche parole di input, come ChatGPT, che sembravano lontanissime qualche mese fa, sono ormai una realtà di cui tante aziende che lavorano nel campo della creazione di contenuti già hanno cominciato ad avvalersi. Per quanto tempo ancora sarà economicamente vantaggioso per una testata pagare uno stuolo di giornalisti (comunque sottopagati) per produrre articoli “umani”, quando è possibile ottenere lo stesso risultato con pochi euro di abbonamento annuale ad una azienda come potrebbe essere OpenAI?

Il numero dei professionisti di questi settori calerà drasticamente: rimarranno pochi umani di altissimo profilo che varrà ancora la pena di pagare per il loro contributo creativo, cioè quel quelle idee che le AI non sono in grado di produrre. Tutti gli altri saranno rimpiazzati da strumenti in mano a grandi aziende tech che venderanno i loro servizi in cambio di un abbonamento o di un prezzo forfettario per ciascun contenuto generato.

Altro problema è quello legato all’impatto ambientale. La tecnologia su cui si basano attualmente le AI non è affatto efficiente: generare una singola immagine richiede un’immensa potenza di calcolo e, di conseguenza, un’immensa quantità di energia. Gli ingegneri informatici ne sono consapevoli e un grosso filone della ricerca sulle AI si sta dedicando a creare modelli di reti neurali più snelli, che richiedano meno passaggi e quindi una potenza di calcolo inferiore per ottenere gli stessi risultati. Con la tecnologia attuale, tuttavia, l’impatto ambientale di questa tecnologia non può essere ignorato, soprattutto considerando che già oggi Internet è responsabile per una quantità di emissioni paragonabili alle industrie più inquinanti, come quella dei voli aerei.

Opera digitale realizzata con AI, prompter Francesco D'Isa
Opera digitale realizzata con AI, prompter Francesco D’Isa

Cosa fare quindi?

La tecnologia AI TTI (e le altre applicazioni dell’intelligenza artificiale che vedremo emergere nei prossimi anni, se non mesi) è semplicemente troppo potente per essere rigettata in toto o ignorata. Con il tempo la critica artistica, ma anche la legislatura e le leggi del mercato, daranno ragione o torto a chi oggi si interroga sul modo in cui le AI impatteranno le nostre vite. Quello che possiamo fare oggi come singoli utenti, oltre a continuare a porci domande, è cercare di praticare un “prompting etico”. Se, quanto e in che modo sia possibile promptare eticamente è una domanda che lasciamo alla sensibilità di ciascun*. Noi vogliamo lasciarvi condividendo i 7 punti per una prompt art etica stilati da Vanni Santoni:

1) Il prompter si qualificherà sempre come prompter e non come “artista” o altro termine che rimandi a differenti pratiche o arti.

2) Ogni immagine creata con A.I. verrà sempre indicata come tale.

3) Nel caso includa nel prompt nomi di artisti, il prompter utilizzerà solo nomi di autori morti da 70+ anni.

4) In nessun caso l’immagine creata con A.I. verrà “watermarkata”: si indicherà, fuori dall’immagine, che è stata realizzata da tizio caio con pinca pallina, laddove tizio caio è il nome dell’artista e pinca pallina è il nome e la versione dell’A.I. utilizzata.

5) Le immagini realizzate con A.I. che vogliano dignità di “opera fatta con intelligenza artificiale” non verranno photoshoppate o ritoccate: tutto deve essere solo frutto dell’abilità nel prompting.

6) Scopo della futura ed eventuale “arte del prompting” non sarà cercare di riprodurre arte umana in modo indistinguibile, bensì forzare le possibilità del software allo scopo di ottenere immagini altrimenti impensabili e mai viste (cfr. “Maivismo”, Pazienza/Sparagna)

7) La forma ideale del lavoro su A.I. che aspiri a riconoscimento artistico sarà la “serie”. Ciò perché solo tramite le serie – stimiamo da 8 a 12 immagini il range ideale – si possono far apprezzare le iterazioni e le varianti, e dunque l’effettivo lavoro di ricerca del prompter sui risultati dell’A.I.

 


In copertina: Opera digitale realizzata con AI, prompter Vanni Santoni.

Giovanni Luca Molinari
Giovanni Luca Molinari

Dopo avere studiato Humanities tra Italia e Germania, oggi lavoro a Milano nel campo della Comunicazione. Appassionato di lingue e letteratura, ma anche arti visive, anime, meme, giochi da tavolo... In questo momento sono particolarmente affascinato da come le domande del presente prendano forma in nuove e vecchie forme espressive.