Se l'AI è una "scatola nera" in cui non possiamo vedere, come possiamo fidarci dei suoi output?
Il Professor Davide Mottin, esperto nell'analisi di dati complessi e reti di conoscenza presso l'Università di Aarhus, ci guida nella sua ricerca, svelando come l'AI stia rivoluzionando la scoperta di nuovi farmaci e la gestione dei sistemi complessi (come gli aeroporti).
Un'esplorazione profonda sul funzionamento delle reti neurali, il problema delle allucinazioni e la necessità di rendere l'AI "verificabile".
Link utili
Trascrizione
Davide: Ciao e benvenuti! Siamo qui oggi con Davide Mottin, professore associato presso il Dipartimento di Informatica dell'Università di Aarhus. Insieme a lui esploreremo come l'intelligenza artificiale ha trasformato la ricerca sui grafi e le reti di conoscenza, le applicazioni pratiche di queste tecnologie e le prospettive future. Davide, vuoi raccontarci intanto quali sono i tuoi principali campi di ricerca?
Davide Mottin: Certo. Il mio campo di ricerca in realtà è l'analisi dei dati, un ambito piuttosto trasversale. Nello specifico, mi occupo di reperimento di informazioni all'interno di dataset complessi e di machine learning, in particolare per fare predizioni su fenomeni intricati. Lavoro soprattutto con dati che hanno una struttura a grafo, ovvero a forma di rete. Pensa a una rete sociale, che connette diversi utenti con interazioni ramificate, oppure ai grafi di conoscenza, come Wikipedia: lì le pagine, che noi chiamiamo "entità", sono collegate tra loro da legami semantici. Ad esempio, Sergio Mattarella e la Repubblica Italiana sono connessi dal concetto logico di "essere presidente".
Fabio: Parlavi di sistemi complessi. Ci puoi dare qualche numero per farci capire quando un sistema diventa effettivamente "complesso"?
Davide Mottin: Prima dell'avvento dell'intelligenza artificiale si parlava di "Big Data", per indicare volumi enormi (terabyte o petabyte di dati) che arrivano a grande velocità e non sono statici. La vera complessità subentra quando i dati non si possono più inserire in semplici tabelle. Una tabella di entrate e uscite di una banca è semplice; una rete sociale, dove tu partecipi a un evento, sei amico di altre persone e interagisci, è complessa. L'altra grande sfida è riuscire a capire qual è il dato vero e ottenere output che siano sempre verificabili da un umano.
Davide: Sappiamo che nel 2023 hai pubblicato delle ricerche in cui sfruttavi l'intelligenza artificiale e i tuoi studi sui grafi per la scoperta di nuovi farmaci. È questo un esempio di sistema complesso?
Davide Mottin: Esatto. L'intelligenza artificiale ti dà grande flessibilità. Se una transazione bancaria è un dato semplice, il corpo umano è un sistema complesso, con interazioni tra proteine, geni, farmaci e addirittura condizioni esterne come la temperatura. Pensa anche a un aeroporto: persone, sensori, aerei che arrivano e partono. Le reti neurali alla base dei Large Language Model (come ChatGPT, Mistral o Gemini) riescono a gestire questa complessità unendo in input testi medici, audio, immagini ed esperimenti biologici per produrre una predizione. Dal punto di vista matematico, la funzione che si genera è spaventosamente complicata.
Fabio: Poco tempo fa Anthropic ha pubblicato una ricerca in cui ha cercato di guardare dentro la "scatola nera" per capire come pensa l'intelligenza artificiale. Da quello che abbiamo capito, si accendono certe aree della rete neurale per determinati concetti, ma il ragionamento della macchina non è affatto come il nostro. Mi viene una domanda stupida: le previsioni del tempo, che sono notoriamente difficili, diventeranno corrette grazie all'intelligenza artificiale?
Davide Mottin: Le previsioni meteorologiche sono un vero macello perché intervengono troppi meccanismi impredicibili! Per noi ricercatori, di fronte a un sistema reale estremamente complesso, a volte la soluzione "semplice" è usare un macchinario altrettanto complesso. Non so scrivere la formula esatta per predire il tempo di domani? Bene, allora butto una marea di dati dentro una rete neurale complessa. Non capirò esattamente come produce l'output e non avrò il controllo interno dei passaggi, ma lascerò che sia la macchina, digerendo milioni di dati, a trovare da sola le relazioni nascoste.
Davide: Rimanendo in tema di scatole nere: come gestite il problema delle allucinazioni e della "banalità" dell'output? Sappiamo che se non indirizziamo bene questi motori statistici (tramite il prompting), rischiano di dare risposte banali o inventate.
Davide Mottin: Stiamo iniziando proprio ora un grande progetto europeo sulla robustezza dell'informazione. Al momento, la soluzione migliore per limitare le allucinazioni è la cosiddetta Retrieval-Augmented Generation (RAG). Funziona così: metti a disposizione dell'LLM un database noto e curato da esseri umani (come una Wikipedia ingegneristica o medica) e costringi il modello a usarlo come motore di ricerca interno prima di rispondere. Sfruttando un grafo di conoscenza, puoi seguire i "link" logici e capire perché il modello ha scelto un'informazione. Altrimenti, l'LLM nudo e crudo funziona tramite probabilità: lancia un dado e sceglie la parola più probabile da inserire dopo la precedente, creando frasi che sembrano sensate ma che non sempre lo sono.
Fabio: Quando fai ricerca, il modello te lo crei tu da zero o parti da qualcosa di esistente?
Davide Mottin: Un tempo ho allenato modelli da zero, ma i grandi sistemi moderni fanno parte della categoria dei Foundation Models: reti mastodontiche che hanno già ingerito così tanti dati da aver "capito" qualcosa del mondo. Allenare questi modelli da zero richiede cluster enormi, come il Cineca in Italia o il supercomputer LUMI in Finlandia, composti da migliaia di macchine dotate di schede grafiche da 40.000 dollari l'una. Un gruppo di ricerca universitario non ha i fondi per farlo. Quindi partiamo da modelli open source già allenati (come LLaMA di Meta) e facciamo il fine-tuning, ovvero un riaddestramento specifico, pagando dei server in cloud molto più abbordabili.
Fabio: Questo fine-tuning è la stessa cosa della Low-Rank Adaptation (LoRA) per le immagini o è un addestramento diverso?
Davide Mottin: Ci sono metodi diversi. Nel fine-tuning classico prendi un modello generico e gli riversi sopra tonnellate di dati su un task specifico (es. la biologia) sperando che adatti la sua intelligenza al nuovo ambito. La LoRA, o semplificazione, consiste invece nel ridurre matematicamente l'enorme matrice dei pesi del modello per renderlo più leggero da gestire. Un'altra tecnica molto usata oggi è la "distillazione" (distillation): fai produrre degli output al modello enorme e costoso e li dai in input a un modello più piccolo, insegnandogli a comportarsi allo stesso modo. È quello di cui è stata accusata DeepSeek di recente: hanno usato ChatGPT per "distillare" il loro modello e renderlo super efficiente!
Davide: È molto interessante il problema dell'opacità dei sistemi. Le grandi aziende mettono dei blocchi etici (safeguards), ma c'è sempre chi trova il modo per fargli generare comunque contenuti scorretti, magari dicendogli di imitare un personaggio come Bugs Bunny. Nel tuo campo, usi il concetto di exemplar queries anche per interagire con l'AI e il prompting?
Davide Mottin: Sono ancora in fase di esplorazione, voglio capire bene la tecnologia sottostante. Però ho fatto dei test e funziona abbastanza bene: se dai un esempio specifico al modello ("Dammi un altro esempio analogo a Mattarella come Presidente della Repubblica"), lui segue la logica della exemplar query (ricerca per esempi) e ti fornisce presidenti di altri stati. C'è sempre il dibattito: fornendo un esempio guidi la macchina, ma magari limiti anche il suo potenziale creativo rinchiudendola in un recinto che hai creato tu.
Fabio: Tu sei anche docente, quindi ti confronti spesso con gli studenti. Quali sono secondo te le barriere psicologiche che frenano le persone dall'usare l'AI? Anche Papa Francesco, di recente, l'ha definita una "rivoluzione industriale" da non temere ma da capire.
Davide Mottin: Io dico sempre: usatela, è uno strumento utile. Ha limiti evidenti e sbaglia, ed è giusto che alcuni ricercatori dicano "Calmiamoci prima di metterla a gestire gli ospedali". Ma per il lavoro di tutti i giorni, le paure sono le stesse di quando è arrivato il treno o di quando il computer è entrato nelle case. È a tutti gli effetti una rivoluzione industriale. Io ho una visione molto positiva: se la macchina può fare il lavoro noioso e ripetitivo, ben venga! Significa che noi possiamo dedicare più tempo a fare "l'essere umano", liberando la nostra creatività. L'unica regola è usare il senso critico: l'AI non deve mai sostituire la nostra intelligenza.
Davide: Siamo arrivati in chiusura con le tre domande di pancia! La prima: un libro che ci consigli?
Davide Mottin: Vado sul classico: Io, Robot di Isaac Asimov. Sempre bellissimo.
Fabio: Un prompt specifico da consigliare o un modello con cui sperimentare?
Davide Mottin: Il prompt che funziona meglio è il gioco di ruolo: "Supponi di essere un esperto di..." e poi fai la domanda. Come modello, vi consiglio di scaricare LLaMA di Meta: è open source, è divertente giocarci ed è un ottimo sistema per imparare senza i paletti dei sistemi chiusi.
Davide: Ultimissima: un film, una serie TV o un podcast da guardare?
Davide Mottin: Di cuore direi Star Wars, ma dal punto di vista scientifico impari poco! Invece vi consiglio una docu-serie bellissima su Netflix che si intitola Babies. Mostra come imparano i neonati dal punto di vista scientifico. Vedere un bambino che a 6 mesi riconosce perfino i volti delle scimmie, o che impara concetti sentendoli una sola volta, è scioccante. Noi impariamo con una manciata di esempi, mentre all'intelligenza artificiale servono miliardi di dati e un dispendio energetico folle. L'essere umano è ancora sorprendentemente superiore. Per questo non temo che l'AI prenda il controllo; temo molto di più l'uso sbagliato che gli umani potrebbero farne!
Davide: È una riflessione bellissima per chiudere. Grazie mille di tutto, Davide, è stato un vero piacere!
Davide Mottin: Grazie a voi, buona giornata!