Come l'Intelligenza Artificiale sta riscrivendo le regole della fisica?
In questa puntata, il Prof. Davide Gerosa ci guida nell'affascinante intersezione tra Deep Learning e Astrofisica, svelando come l'AI aiuti i ricercatori a decifrare i segnali cosmici di buchi neri e onde gravitazionali.
Scopri come l'AI stia trasformando la ricerca scientifica da "matita e carta" a un processo computazionale efficiente e critico.
Link utili
Trascrizione
Davide: Ciao di nuovo a tutti! Questa è una nuova puntata del Cantiere AI Podcast. Siamo con il professor Davide Gerosa dell'Università Milano-Bicocca, professore associato di astrofisica. Ciao e grazie di essere qui con noi!
Davide Gerosa: Ciao, sono molto contento di essere qui con voi.
Davide: Ci vuoi raccontare in breve chi sei e cosa fai? Tu nasci come astrofisico e poi hai implementato le tue conoscenze nell'intelligenza artificiale, o viceversa?
Davide Gerosa: Sono un professore di astrofisica presso il dipartimento di fisica qui a Milano-Bicocca. Ho un programma di ricerca e didattica in intelligenza artificiale applicata all'astrofisica. Nasco come astrofisico, quindi la mia conoscenza dell'AI è quasi interamente da autodidatta. Non sono uno sviluppatore "puro" di tecniche di intelligenza artificiale, ma mi interessa la loro applicazione a problemi di carattere fisico e astrofisico. Quando mi sono laureato e ho fatto il dottorato, queste cose non si usavano. La rivoluzione è stata rapidissima e ha investito il nostro campo di ricerca.
Fabio: Proviamo ad andare sul pratico. Qual è stata la prima applicazione in cui hai integrato l'utilizzo di questi algoritmi?
Davide Gerosa: Tra le cose di cui mi occupo ci sono i buchi neri e le onde gravitazionali. I buchi neri sono oggetti stellari così densi che neanche la luce può scappare; sono il risultato della fine della vita delle stelle più massive del nostro sole. Il sistema che ci interessa in particolare è composto da due buchi neri in rotazione l'uno attorno all'altro. La relatività generale di Einstein ci insegna che un sistema del genere perde energia, la binaria si stringe sempre di più fino a fare merger, cioè i due buchi neri si fondono in uno solo. Questo evento, uno dei più energetici dell'universo, perturba lo spaziotempo e genera le onde gravitazionali, un po' come un sasso gettato in uno stagno che crea un'ondina che arriva fino ai nostri rivelatori a terra. Io studio cosa ci dice questa popolazione di oggetti sulla vita delle stelle.
Davide: E l'intelligenza artificiale come entra in gioco?
Davide Gerosa: I miei colleghi hanno codici numerici complessi che simulano la vita delle stelle, ma sono molto "costosi": ci mettono tantissimo tempo a girare. Per poter confrontare i dati osservati con le predizioni teoriche in modo rapido ci serviva un "emulatore", ovvero uno strumento che imparasse come è fatta la simulazione stellare senza doverla eseguire fisicamente ogni volta.
Davide: Giusto per capire, di che tempi parliamo per una simulazione classica? Ore, giorni?
Davide Gerosa: Se fai una simulazione fatta bene in idrodinamica, ci vogliono anni! Ma per entrare in una pipeline statistica di confronto con i dati a noi servono tempi nell'ordine dei millisecondi, perché dobbiamo fare milioni di valutazioni ($10^6$ o $10^7$). Una simulazione fisica tradizionale in un millisecondo è impossibile. Così, tre o quattro anni fa, abbiamo creato una rete neurale (neural network) che emula le simulazioni fisiche, rendendo il confronto coi dati estremamente efficiente. Dal punto di vista del deep learning, è un classico problema di conditional density estimation.
Fabio: Rispetto a questo, secondo te l'intelligenza artificiale "democratizza" la scienza, permettendo a ricercatori di vari ambiti di spaziare di più?
Davide Gerosa: Vedo due facce della medaglia. Da un lato, l'AI abbatte barriere. Pensa solo alla lingua: la scienza si fa in inglese, e oggi ricercatori di paesi in via di sviluppo, che magari prima erano penalizzati dalla lingua, possono comunicare e pubblicare idee eccellenti molto più facilmente grazie ai tool di traduzione o generazione testo. Dall'altro lato, c'è un rischio: per applicare un pezzo di rete neurale è cruciale conoscere il dominio di applicazione. L'informatico che non sa niente di medicina e prepara un trattamento per il cancro è pericoloso. Lo stesso vale per l'ingegneria civile: non puoi costruire un ponte se non sai nulla di fisica.
Davide: In ricerca, un'altra cosa molto importante di cui ti sei occupato è il problema dell'"etichettatura" (relabeling). Ci spieghi di cosa si tratta?
Davide Gerosa: È un lavoro recente. Quando osserviamo un'onda gravitazionale generata da due buchi neri, il segnale che ci arriva è un'unica serie temporale (Time Series) che contiene intrinsecamente le informazioni di entrambi gli oggetti. Ma noi volevamo capire le proprietà dei singoli oggetti (ad esempio: esistono buchi neri da 50 masse solari?). Il problema era come separare le due componenti. La soluzione è arrivata usando metodi di semi-supervised learning, in particolare il semi-supervised clustering, che permette di trovare la struttura nei dati analizzando relazioni preesistenti anche senza avere etichette ben formate in partenza.
Fabio: Questo immagino vi faccia risparmiare un'infinità di tempo, giusto?
Davide Gerosa: Sì, l'operazione di relabeling sui dati pubblici degli interferometri LIGO e Virgo, se fatta in post-processing, si risolve in pochi minuti.
Davide: Ci sono problemi che fino a ieri sembravano irrisolvibili e che oggi l'AI vi sta aiutando a superare?
Davide Gerosa: Assolutamente. Nel nostro campo usiamo la statistica bayesiana, che non valuta l'errore ripetendo un esperimento tante volte (come la statistica frequentista), ma valuta la "credibilità" della misura tenendo conto sia dei dati attuali (likelihood) sia di ciò che sapevamo prima (prior information). Il problema è che le tecniche di campionamento standard (come le Markov Chain Monte Carlo o MCMC) non scalano più. I rivelatori oggi catturano troppi eventi. L'introduzione della Simulation-based inference – la soluzione del deep learning a questo problema – ha rivoluzionato il campo.
Fabio: E di quanto ha migliorato le prestazioni?
Davide Gerosa: Otteniamo gli stessi risultati di prima in un millesimo del tempo. Ovviamente c'è una fase di transizione in cui teniamo attivi entrambi gli approcci per verificare che il nuovo modello funzioni correttamente, ma la direzione futura è chiaramente quella.
Davide: Ma l'AI non risolverà tutti i problemi magicamente, vero?
Davide Gerosa: Certo che no. È solo uno strumento molto potente. Dà un'accelerata gigantesca, ma l'idea devi avercela tu. Se hai un'auto molto veloce che ti porta da A a B, devi comunque sapere dove stai andando!
Fabio: Spostandoci sul lato divulgativo: pensi che usare ChatGPT per farsi riassumere o semplificare un paper scientifico sia utile?
Davide Gerosa: Secondo me è un'operazione pericolosa e non ne abbiamo ancora capito la portata. Fare un riassunto significa estrarre le informazioni cruciali sfrondando quelle superflue. È difficile per un cervello umano, figuriamoci per un Large Language Model che rischia di travisare l'idea scientifica di fondo. Invece, lo trovo utilissimo come motore di ricerca avanzato: se ho bisogno di sapere se esiste un teorema specifico, l'AI non mi dà la soluzione matematica finale, ma mi indirizza nella giusta direzione, come si faceva 50 anni fa andando in biblioteca.
Davide: E per aumentare la creatività o fare brainstorming?
Davide Gerosa: Anche qui sono cauto. I Large Language Models sono "allenati" su ciò che esiste già, mentre la creatività è per definizione creare qualcosa di nuovo. L'AI invece è fenomenale per sistemare testi: se devo mandare una mail lunga e formale a un collega in inglese per spiegargli un problema, butto giù due righe grezze e l'AI mi genera un testo perfetto in un minuto.
Fabio: I tuoi studenti usano l'AI per i compiti o per scrivere codice?
Davide Gerosa: Sicuro! Insegno statistica e machine learning. Quando all'esame orale mi portano un codice, a me non interessa se se lo sono fatti scrivere dall'AI (prima lo copiavano da Stack Overflow!). Quello che mi interessa è che abbiano capito cosa fa quel codice. Se gli chiedo "Che assunzione hai fatto sugli errori di misura qui?" e non sanno rispondere perché il codice gliel'ha scritto ChatGPT, l'esame non lo passano. Se invece hanno risparmiato 10 minuti di ricerca sulla sintassi e li hanno usati per studiare meglio la fisica, buon per loro.
Davide: Affronti anche il tema dell'etica con loro?
Davide Gerosa: Sì, fa parte del corso. In astrofisica l'impatto etico è marginale (io non curo persone e non costruisco ponti), ma i miei studenti domani faranno vari lavori. Porto l'esempio delle self-driving cars (auto a guida autonoma). Se devi scegliere tra investire un albero (e rischiare tu) o una persona, nell'auto normale la scelta è dettata dall'istinto del momento. Nell'auto autonoma, questa decisione è presa a monte da un programmatore che ha scritto letteralmente una riga di codice "if albero, then...". Questo sposta il problema dalla reazione umana alla legislazione e alla politica.
Fabio: Siamo in chiusura! Le quattro domande veloci. Un libro che ci consigli?
Davide Gerosa: Vi consiglio un libro di fisica molto divertente: The Physics of Soccer. Parla della fisica dietro al calcio, dalle turbolenze dell'aria sulla palla fino all'analisi statistica della Premier League per prevedere i risultati.
Davide: Un tool di intelligenza artificiale che usi spesso e un prompt?
Davide Gerosa: Come tool uso JAX, una libreria sviluppata dai ricercatori di Google fenomenale per il machine learning. Scrivo sempre più codice lì. Il mio prompt classico per ChatGPT invece è: "Here is the content, I need to do this, please put it in good shape". Fa il lavoro sporco per me.
Fabio: Hai notato differenze usando prompt in inglese o in italiano?
Davide Gerosa: In inglese è nettamente migliore. Questi modelli sono allenati su internet, e la percentuale di internet scritta in inglese è stellare rispetto all'italiano. Anche se sono bravissimi a tradurre, il volume di dati nativi in inglese dà una precisione maggiore.
Davide: Ultima domanda: un film, una serie TV o un podcast a tema spazio o AI?
Davide Gerosa: Niente Interstellar e, seppur a malincuore da grandissimo fan, niente Star Wars! Vi consiglio Gravity. Visivamente è bellissimo e mostra la Terra come qualcosa di vicino ma irraggiungibile, rendendo perfettamente l'idea di quanto lo spazio sia un ambiente inospitale e del desiderio umano di tornare a casa.
Fabio: Bellissimo! Grazie mille Davide.
Davide Gerosa: Grazie a voi, ciao!