Roberto Viola nel suo libro, Il codice del futuro scrive: “Siamo all’inizio di una nuova era della creatività che va sostenuta”. Di fatto, l’intelligenza artificiale generativa dando accesso e possibilità di scambio immediato con praticamente tutto il capitale cognitivo globale del momento ha già iniziato un’accelerazione d’innovazione senza precedente. Ormai l’IA può rispondere a tutte le domande e “ricontestualizzare” tutti contesti cognitivi in cui ci troviamo. È per questo che la chiamo IA “parlante”. Perché sia che si parli a voce o che si scriva, ChatGPT sta effettivamente chattando, “parlando” all’utente, cioè sta scambiando parole con una persona. E qui la scrittura e il discorso vocale si confondono, ecco perché secondo me siamo all’inizio dell’era dello “Scripta volant”. Ed in questo contesto le questioni dell’identità e della privacy, della paternità e della proprietà diventano tutte profondamente interconnesse. La domanda è: come risolvere il problema quando è una macchina a parlare per la maggior parte del tempo?
Identità e paternità
Da “Hoc fecit Michelangelo” alla generosa rinuncia al premio SONY di fotografia di Boris Eldagsen in dicembre 2002, si gioca la storia della proprietà intellettuale cioè la rivendicazione di paternità secondo l’identità del creatore di contenuto. La rivendicazione della proprietà è iniziata molto prima con Romolo e Remo. Ma a chi appartiene ciò che la macchina dice?
La natura del discorso digitale
Nell’IA generativa non si tratta di una cieca ripetizione, ma di un contenuto originale, generato dalla domanda, caratteristica del mondo orale. Proprio come con le nostre parole innoviamo, un poco, ogni volta che parliamo, in qualche modo ogni risposta di GPT è nuova. Il discorso della macchina non si basa unicamente su modelli già esistenti nei database, ma su token digitali che scompongono le frasi in parole e persino le parole in sillabe o meno. Quindi, la macchina ricrea il discorso, mettendo insieme bit e dati disponibili, proprio come il nostro cervello mette insieme in formato comprensibile le parole e le frasi richiamate dal contesto. Secondo Paolo Benanti e Sebastiano Maffettone: “Una delle questioni chiave da affrontare sarà che legame è possibile stabilire tra un testo generato dalla macchina di fronte a un prompt umano e i miliardi di frammenti di testo, a volte completamente scollegati tra loro e trasformati in parametri, su cui la macchina è stata addestrata”.
L’IA generativa ha tutto il carattere del discorso orale, tranne che in più c’è la registrazione cioè la trascrizione. La proprietà, tuttavia, dovrebbe appartenere alla fonte del discorso/testo, proprio come per il linguaggio orale.
Quali conseguenze logiche possiamo trarre da questa premessa?
In primo luogo, che l’input di contenuto proveniente dalla mente dell’utente, a seconda del valore e della domanda, è soggetto alle leggi standard sul diritto d’autore che accertano la paternità e la proprietà. Tutti gli input, compresa l’ingegnerizzazione dei suggerimenti, dovrebbero essere suscettibili di regolamentazione del diritto d’autore.
In secondo luogo, tutti gli output risultanti da quanto sopra, salvo eccezioni, dovrebbero essere esenti da qualsiasi richiesta di diritto d’autore. Tutto ciò che deriva dall’IA generativa dovrebbe, quindi, essere considerato come pubblico dominio, così come l’uso normale (cioè non formale) del linguaggio orale?
In terzo luogo, la fornitura del servizio dovrebbe essere definita come un “servizio pubblico” e remunerata di conseguenza.
Esenzioni
Posso chiedere diritto per un’opera che io creo dalle risposte dell’IA generative? No, secondo la regola generale proposta sopra posso solo richiedere diritti sulle domande e i prompt. Come abbiamo letto, il giudice Beryl A. Howell della US District Court for the District of Columbia ha negato il diritto di copyright a un’opera d’arte fatta dall’IA generativa.
Detto questo, come suggerisce la direttrice Lucilla Sioli (DG Connect EU), “ci sono dei possessori di diritti di copyright che non vogliono che le loro opere possano essere utilizzate per allenare questi modelli. Una prima risposta tecnicamente semplice sarebbe di bloccare l’accesso ai LLM”.
Si può fare. Come scrivono Paolo Benanti e Sebastiano Maffettone: “The Verge, il quotidiano statunitense ha già bloccato il web crawler di OpenAI, uno strumento automatico che raccoglie tutti i testi pubblicati su un sito, che perciò non può più adoperare i contenuti pubblicati per «alimentare» il software di intelligenza artificiale. Inoltre, dall’inizio di agosto il NYT ha aggiornato i suoi termini di servizio vietando l’uso dei suoi pezzi per l’addestramento dei modelli di IA”.
Un’alternativa alla negazione del diritto d’autore sia al nuovo creatore sia ai proprietari del materiale “preso in prestito” dal LLM è proposta da Jaron Lanier, in quello che chiama il rispetto della “dignità dei dati”: “In un mondo con la dignità dei dati, le cose digitali dovrebbero essere tipicamente collegate agli esseri umani che vogliono essere conosciuti per averle create. In alcune versioni dell’idea, le persone potrebbero essere pagate per ciò che creano, anche quando viene filtrato e ricombinato attraverso grandi modelli, e i centri tecnologici guadagnerebbero per facilitare le cose che le persone vogliono fare”.
Come verrebbero identificati i dati pre-utilizzati?
Lanier, a questo proposito, precisa: “Un approccio basato sulla dignità dei dati permetterebbe di rintracciare i collaboratori più unici e influenti quando un grande modello fornisce un risultato prezioso. Per esempio, se si chiede a un modello di creare un film d’animazione per i figli in un mondo dipinto a olio con gatti parlanti che vivono un’avventura, si può calcolare che alcuni pittori a olio, ritrattisti di gatti, doppiatori e scrittori – o le loro proprietà – siano stati essenziali per la creazione del nuovo capolavoro. Verrebbero, cosi, riconosciuti e motivati. Potrebbero persino essere pagati”.
Prima che un creatore di contenuti possa avanzare una richiesta di risarcimento alla macchina, dovrebbe essere dimostrata una percentuale ragionevole di somiglianza e ‘citazioni’. Il fatto è che, sebbene la ricreazione del contenuto sia basata su dati indipendenti, i modelli che definiscono la forma della ricreazione sono bloccati nel database del fornitore, il che è solo uno dei potenziali motivi di rivendicazione da parte dell’utente. L’altro è il sospetto di plagio diretto. Entrambi sono soggetti alla legge sul diritto d’autore. Il primo è facile da risolvere: le leggi sul diritto d’autore esistenti possono essere adattate di conseguenza.
Il vero problema è la messa a disposizione dei contenuti dell’utente e il coinvolgimento della proprietà intellettuale. Qui la giurisprudenza ha bisogno di una riflessione lungimirante. In linea di principio, ovunque si trovi nelle biblioteche pubbliche, nei negozi o nelle collezioni private, il contenuto è regolato dalle stesse leggi sul diritto d’autore esistenti. Ma cosa succede quando si trova in un database, sia esso privato, nel proprio computer, o commerciale, come nel caso di centri dati come Open AI? La proprietà intellettuale è un problema sia privato che pubblico. Da un lato, essendo originata dalla mente e dalle azioni di una persona o di un gruppo, dovrebbe mantenere i diritti privati e si potrebbe pensare a un compenso (come dimostra la pratica della Sacem di raccogliere e distribuire i diritti generali dei musicisti; vedi https://www.capital.fr/entreprises-marches/sacem-collecte-record-a-1413-milliard-deuros-en-2022-1471933). D’altra parte, nel contesto più ampio del valore potenziale per la comunità e, fino a un certo punto, poiché il lavoro creativo ha origine all’interno e dalla comunità, i diritti dovrebbero essere trasferiti alla comunità.
Sull’identità e la privacy
La privacy, come tutti sappiamo fin troppo bene, è gravemente minacciata, non solo perché siamo invasi e tracciati, ma anche perché il nostro spazio mentale individuale per l’innovazione si sta riducendo. Fate i conti: più delegate la memoria di momenti e pensieri, meno la vostra mente contiene. Il suo volume è una cosa flessibile. Oliver Wendell Holmes diceva che “una volta che una grande idea è penetrata nella mente, non recupera mai le stesse proporzioni”. In questo momento è vero il contrario. Ben poco, in realtà, è destinato a rimanere in quella mente e quindi tende a perdere sia volume che flessibilità. Forse dobbiamo fare qualcosa nelle nostre scuole e non basterà parlare con la macchina. E questa potrebbe essere la vera perdita in termini di innovazione.
Quindi, cosa possiamo fare?
La prima cosa da capire è che la privacy è uno spazio mentale. Spesso richiede il silenzio per essere pienamente coinvolta. La seconda è che la sua dimensione dipende dal contenuto e dall’uso. Quale dimensione degli esseri umani vogliamo enfatizzare? Se è la creatività, allora, per aumentare le possibilità di pensiero creativo, la mente deve mantenere e curare una quantità sufficiente di contenuti. L’apprendimento è una sorta di ginnastica per la mente, un esercizio quotidiano (se non orario per alcune persone) su come collegare esperienza e pensiero. L’intelligenza artificiale generativa aiuterà in questo senso, ma non sostituirà l’apprendimento. La privacy non è solo il diritto di essere lasciati in pace quando e come serve, ma anche, in ultima analisi, il diritto di pensare.