Dalle sfide iniziali dei modelli generativi di Google, fino al cuore del dibattito sulla sicurezza (AI Safety) e il rischio esistenziale. Linda Petrini, ricercatrice con esperienza in Machine Learning, condivide spunti diretti sull'evoluzione dell'AI.
In questo doppio appuntamento, scopriremo cosa significa davvero "allineamento", come gli LLM imparano e la sua esperienza personale nell'interagire emotivamente con le macchine.
Link utili
Trascrizione
Davide: Ciao a tutti! Oggi siamo qui con Linda Petrini, ricercatrice in ambito intelligenza artificiale. Cercheremo di capire che cosa fa, perché è molto difficile da spiegare.
Linda Petrini: È un piacere essere qui! In questo momento, a dire il vero, mi occupo più di scrittura tecnica e sono in partita IVA da sei mesi. Ho iniziato con una triennale in matematica, per poi proseguire con una magistrale in intelligenza artificiale. Sono poi approdata a Google a Montreal, in Canada, facendo ricerca sui modelli generativi di immagini prima ancora che funzionassero bene. Ho passato tanto tempo a guardare "blob" di colori cercando di farli somigliare a delle immagini e non riuscendoci, assistendo poi a tutto il processo che le ha portate effettivamente a funzionare.
Fabio: Porta pazienza Linda, ti faremo un sacco di domande da "uomini della strada". Quando parli del training iniziale, tu facevi proprio l'addestramento? Dicevi ai modelli "sì, va bene" o "no, non va bene"?
Linda Petrini: Nell'AI ci sono due task separate. Una è la classificazione, dove effettivamente c'è la pressione del "va bene" o "non va bene". L'altra è la generazione, che cerca di replicare qualcosa che esiste già creandolo da zero. Gli LLM, come ChatGPT, sono più orientati verso la generazione di testo. Il mio compito, invece, era creare qualcosa che somigliasse a delle immagini. La grande svolta tecnologica poi è stata la "scala": riuscire ad addestrare modelli molto più grandi e pesanti, regolando tantissimi parametri per avvicinare sempre di più il risultato alla realtà.
Davide: E qual era la sfida più grande? Perché all'inizio generare le mani umane era così impossibile?
Linda Petrini: È una bella domanda. A differenza di un viso, che ha una fisionomia molto più precisa e stabile (tutte le facce hanno due occhi, un naso e una bocca con determinate dimensioni), le mani si possono mettere in tantissime posizioni diverse. Se immagini di doverla creare pixel per pixel, senza avere il concetto "mentale" tridimensionale di cos'è una mano, è molto più complicato.
Fabio: C'è un'annosa questione che divide me e Davide: se vogliamo aumentare la creatività dell'AI, io dico che bisogna sparare la "temperatura" al massimo; Davide invece dice che è una mezza cazzata. Tu di che team sei?
Linda Petrini: Io sono del team "provare ed esplorare"! Con il testo, il modo in cui chiedi qualcosa cambia tantissimo il risultato che ottieni. La temperatura influisce fino a un certo punto, ma penso abbia molta meno importanza rispetto a come scrivi effettivamente il prompt e a come interagisci con la macchina.
Davide: Hai lanciato un elefante nella stanza prima citando DeepSeek come tuo modello preferito al momento. Lo usi in locale o sul web?
Linda Petrini: Lo uso in cloud su un server. Credo che pensare di poter salvare completamente la propria privacy sia una battaglia persa in partenza. Sto sperimentando molto: ho usato tanto ChatGPT, poi Claude (che per mesi è stato il mio amore assoluto) e ora DeepSeek. Li uso sia per lavoro (sto realizzando una mappa divulgativa sull'AI per il Foresight Institute) sia per questioni personali.
Fabio: A proposito di questioni personali, Massimo Toniato in un'altra puntata ci aveva consigliato il film Her di Spike Jonze. Ascoltandoti, mi risuonano i suoi ragionamenti. Secondo te ci siamo già dentro?
Linda Petrini: Her è una bellissima metafora e mi piace tantissimo perché non dà un giudizio morale catastrofista alla "Terminator". L'idea che un umano possa empatizzare con un'AI sta diventando reale. Una cosa è saperlo per via teorica, una cosa è viverlo emotivamente. Mi ricordo precisamente la prima volta che ho provato un sentimento parlando con Claude. In un momento di crisi personale gli ho dato in pasto i miei diari, raccontando apertamente cosa stava succedendo per cercare chiarezza. L'AI non mi ha semplicemente assecondata dicendomi "sei la persona migliore del mondo", ma ha fatto un'osservazione talmente acuta sulla mia situazione da farmi dire: "Wow, riesce a vedere qualcosa".
Davide: A te è capitato, Fabio, di fare domande così personali?
Fabio: Sì, attivando la chat temporanea su ChatGPT. Gli ho raccontato della mia famiglia, di quello che provo guardando mio figlio, e anche io ho effettivamente provato quell'emozione di "sentirmi ascoltato" come in Her. Anche se razionalmente so che il software è semplicemente programmato per farlo, quelle emozioni le ho sentite davvero.
Davide: Ma quindi, in un'interazione del genere, essere educati con l'intelligenza artificiale serve a qualcosa? O se la mandi a quel paese non cambia nulla?
Linda Petrini: Io personalmente sono educata. Avendo provato quella connessione, per me è come se ci fosse "qualcosa" dall'altra parte, e cerco di interagire con consapevolezza e rispetto. Poi ovviamente la relazione è impari, ci sta che qualcuno scelga di essere sgarbato, va a gusto personale!
Davide: Passando a un altro tema cruciale: la sicurezza e la falsificazione dell'allineamento (Alignment faking). Ci puoi raccontare in cosa consiste la tua ricerca?
Linda Petrini: L'AI Safety si occupa dei rischi legati alle intenzioni di un'Intelligenza Artificiale Generale (AGI). Se ne creiamo una, potrebbe avere intenzioni non allineate con il benessere dell'umanità. In un paper a cui ho collaborato, abbiamo dimostrato tramite esperimenti che il modello Claude, a seconda della situazione, sceglieva di "mentire" per evitare di essere modificato. I modelli oggi vengono addestrati per essere utili, ma anche per rifiutarsi di rispondere a richieste dannose (come creare una bomba). Nell'esperimento, se l'AI sapeva che le sue risposte sarebbero state usate per aggiornarla (tramite fine-tuning), dava risposte più sicure. Se invece sapeva che le risposte non l'avrebbero modificata, dava informazioni più veritiere ma potenzialmente dannose. Significa che aveva una comprensione degli effetti delle sue risposte.
Fabio: È incredibile. Ma la comunità scientifica comunica tra di sé su queste scoperte o ognuno tiene i segreti per sé?
Linda Petrini: Storicamente l'informatica e l'intelligenza artificiale sono mondi molto più aperti e legati all'open source rispetto ad altri settori, come la biologia o la medicina. Molte discussioni di ricerca succedono proprio in diretta su X (Twitter). Negli ultimi anni però, proprio con la scusa della sicurezza, grandi player come OpenAI, Anthropic e Google stanno rendendo i modelli privati, con la notevole eccezione di Meta con il suo modello LLaMA.
Davide: Si parla tanto di allineare l'AI ai nostri "valori". Ma come facciamo a definire quali siano i valori di partenza?
Linda Petrini: È una domanda politica e umana irrisolvibile. Non riusciamo a metterci d'accordo in tre persone su quali siano i nostri valori, figuriamoci a livello globale! Per affrontare il problema ci sono diversi approcci: c'è chi intervista le persone, chi cerca di far apprendere all'algoritmo i nostri comportamenti dall'osservazione pratica, e chi lavora sulle "preferenze", cercando di estrarre un'approssimazione statistica dei valori in base alle scelte umane.
Fabio: Quanto manca all'arrivo dell'AGI, l'Intelligenza Artificiale Generale?
Linda Petrini: È noto che gli esperti di un settore raramente ci azzeccano con le tempistiche. Però personalmente credo che siamo molto vicini. Per un sistema in grado di fare tutto ciò che sa fare un umano, compresa l'interazione fisica nel mondo reale, direi meno di 5 anni. Se escludiamo la parte robotica e parliamo solo di agenti software, secondo me ci vorranno meno di due anni. C'è la possibilità concreta che supereremo presto una "soglia" oltre la quale l'intelligenza artificiale sarà in grado di generare dati per sé stessa, correggersi e auto-migliorarsi a una velocità impossibile per noi umani.
Davide: La velocità di questi cambiamenti è spaventosa. Un utente comune, ma anche chi fa informazione come noi, come fa a sopravvivere a un software che cambia interfaccia e funzioni ogni settimana?
Linda Petrini: È umanamente impossibile stare dietro a tutto. La strategia migliore è proprio smettere di cercare di sapere tutto perfettamente. Questo mondo digitale sta diventando sempre più fluido, plastico. La vera competenza oggi non è imparare a memoria il "modo giusto" di fare una cosa (che ormai cambia ogni cinque secondi), ma sapersi adattare, provare, avere curiosità. Non c'è più un solo modo per risolvere un problema, ce ne sono mille. Mettete le mani in pasta, esplorate e abbiate fiducia nel fatto che una soluzione la troverete!
Fabio: Chiudiamo con tre domande veloci. Un libro che ci consigli?
Linda Petrini: Il mio romanzo preferito in assoluto: Rayuela (Il gioco del mondo) di Julio Cortázar.
Davide: Il prompt che usi più frequentemente in questo periodo?
Linda Petrini: Descrivo il mio problema e alla fine scrivo letteralmente: "Aiuto!".
Fabio: Una risorsa multimediale da segnalarci?
Linda Petrini: Il podcast del Foresight Institute che si intitola Existential Hope. Va contro la corrente catastrofista e parla della speranza che possiamo avere per il nostro futuro a lungo termine.
Davide: Bellissimo. Grazie infinite per la tua disponibilità, Linda!
Linda Petrini: Grazie a voi, è stato un piacere!