Sora, la nuova intelligenza artificiale di OpenAI. Da testo a video realistici, non senza dubbi etici

Un annuncio difficile da elaborare. Soprattutto visto che il mondo, forse, non ha ancora metabolizzato Papa Francesco con il giubbotto Balenciaga. Il confine tra vero e falso si assottiglia, e ci sono legittime preoccupazioni

Sora può creare un video partendo da una linea di testo. Il nuovo “bambino” di OpenAI, l’azienda di Sam Altman a metà tra la vocazione messianica e lo spirito commerciale, sarà in grado di generare video realistici partendo da un cosiddetto input testuale. Un’evoluzione velocissima rispetto agli strumenti text-to-image ormai entrati nella quotidianità come MidJourney, DALL-E e compagnia cantante. 

I primi risultati – pubblicati sul sito ufficiale – sono davvero stupefacenti, con navi pirata che si scontrano a cannonate in una tazzina di caffè in tempesta e una giovane ragazza che cammina per le scintillanti strade di Tokyo. E poi ancora due Mammuth che si avvicinano alla telecamera, un trailer spaziale con primi piani dettagliati e iperrealistici, e un tenero mostriciattolo animato che gioca con una candela.

Un annuncio difficile da elaborare. Soprattutto visto che il mondo, forse, non ha ancora metabolizzato alcune delle immagini più celebri generate da uno strumento di intelligenza artificiale. Come dimenticare la stilosità di Papa Francesco con un giubbotto bianco Balenciaga, oppure Donald Trump placcato con forza dalla polizia.

Questi finti “scatti”, ampiamente circolati su internet, hanno messo in crisi il confine tra ciò che è reale e ciò che non lo è. Una sottile linea ora ancora più sottile “grazie” a Sora, anche se Open AI ha dichiarato di stare lavorando con persone esperte di “disinformazione, contenuti offensivi e bias per testare il nuovo modello”.

Video generato da Sora

Video generato da Sora

Lo scorrere di questi filmati infatti evoca strane sensazioni. Un po’ di paura: questi strumenti sostituiranno il lavoro dei creativi e non? (Anche il giornalismo non è esente da questa preoccupazione, la scelta di Buzzfeed ne è la dimostrazione). Estasi: il risultato ottenuto in termini di innovazione è incredibile.

Ma Sora lascia anche perplessi: si notano delle imprecisioni, che causano un effetto straniante. E poi, quale sarà la loro utilità? Saranno davvero in grado di generare, per dire, un film intero? Le IA “sanno” veramente qualcosa? Possono impararlo? Oppure continueranno a essere modelli matematici che ripetono a pappagallo? 

La certezza, ad ora, è una sola: il dibattito è polarizzato. Il proliferare delle IA generative ha lanciato un campanello d’allarme difficile da ignorare nell’industria creativa. Fare un bel disegno ora è a portata di click, scrivere un lungo testo articolato pure. E questi strumenti riescono – in parte – nell’impresa perché si mangiano dati alla rinfusa da internet per allenarsi, senza chiedere il permesso a nessuno (il più delle volte sfruttando il fair use accademico).

Proprio per questo l’affaire intelligenza artificiale è stato centrale nel doppio sciopero di Hollywood. Anche in Italia gli attori e i doppiatori hanno mostrato le proprie incertezze di fronte a questi tool, mentre l’UE sta regolando il settore e i cosiddetti “modelli fondativi” attraverso l’AI Act

Video generato da Sora

Video generato da Sora

Il nuovo contratto collettivo nazionale degli attori, ottenuto a fine 2023, ha un intero paragrafo dedicato alla protezione dell’immagine degli interpreti dall’intelligenza artificiale. Come precedentemente riportato da The Hollywood Reporter Roma, anche i doppiatori e le doppiatrici hanno ottenuto una conquista simile nel loro Ccnl.

Nei videogiochi, l’intelligenza artificiale è già molto presente. Nella traduzione ha portato a un abbassamento delle tariffe dei localizzatori freelance, mentre è usata anche nella scrittura di alcuni dialoghi secondari nelle produzioni mastodontiche di Ubisoft.

Anche nel mondo cinematografico gli esperimenti non solo non si sono fatti attendere, ma non intendono fermarsi. La questione non riguarda soltanto l’uso della tecnologia deepfake, ampiamente utilizzata nei blockbuster (vero Indiana Jones?), ma sono stati realizzati anche piccoli progetti che fanno uso unicamente di sistemi di IA generativa.

The Frost di Latent Cinema e Waymark è un esempio, come l’esperimento di animazione del canale YouTube Corridor Digital, arrivando fino all’italiano Cassandra, realizzato dalla scuola Holden e diretto da Demetra Birtone. Ma il risultato è sempre stato abbastanza posticcio, con effetti decisamente dozzinali. 

Lo strumento non era ancora sufficientemente allenato. Sora potrebbe cambiare le carte in tavola?