Ven. Mar 1st, 2024

Rimani informato con aggiornamenti gratuiti

Le nostre vite, come le storie, seguono archi narrativi. Ognuno si svolge in modo unico in capitoli dai titoli familiari: scuola, carriera, trasloco, infortunio, malattia. Ogni trama, o vita, ha un inizio, una parte centrale e una fine imprevedibile.

Ora, secondo gli scienziati, ogni storia di vita è la cronaca di una morte annunciata. Utilizzando i dati del registro danese, che contengono numerose informazioni quotidiane su istruzione, stipendio, lavoro, orario di lavoro, alloggio e visite mediche, gli accademici hanno sviluppato un algoritmo in grado di prevedere il corso della vita di una persona, inclusa la morte prematura, in più o meno allo stesso modo in cui i modelli linguistici di grandi dimensioni (LLM) come ChatGPT possono prevedere le frasi. L’algoritmo ha sovraperformato altri modelli predittivi, comprese le tabelle attuariali utilizzate dal settore assicurativo.

Il fatto che le nostre complesse esistenze possano essere analizzate come frammenti di testo è allo stesso tempo esaltante e sconcertante. Sebbene sappiamo che un reddito generoso è correlato a un’aspettativa di vita più lunga, collegare grandi quantità di dati diversi potrebbe smascherare altri modi in cui i fattori sociali influenzano la salute. Ciò potrebbe informare i politici che cercano di migliorare le nostre probabilità di vivere una vita più lunga e più sana.

Il lato negativo è che c’è qualcosa di quasi assurdamente riduttivo nell’idea di un DeathGPT. Ogni perla della collana della vita – frequentare un corso, un aumento di stipendio, perdere un genitore – sembra troppo personale per alimentare un insieme di dati prevedibili. Ma, in un’era di big data e di intelligenza artificiale per estrarli, dovremo accettare che quelle esperienze qualitative profondamente sentite possano essere catturate quantitativamente in modi che, all’interno delle barre di errore, delineano il destino individuale.

Sune Lehmann, dell’Università Tecnica della Danimarca, che ha condotto la ricerca pubblicata il mese scorso su Nature Computational Science, non trova l’idea sconcertante. “Penso che la somiglianza tra testo e vite sia profonda e sfaccettata”, mi ha detto via email. “Per me è logico che il nostro algoritmo possa prevedere il prossimo passo nella vita umana”.

Sia il linguaggio che la vita sono sequenze. I ricercatori, provenienti dall’Università di Copenhagen e dalla Northeastern University di Boston, hanno sfruttato questa somiglianza. In primo luogo, hanno compilato un “vocabolario” degli eventi della vita, creando una sorta di linguaggio sintetico, e lo hanno utilizzato per costruire “frasi”. Una frase di esempio potrebbe essere: “Durante il terzo anno di collegio secondario, Hermione ha seguito cinque classi facoltative”.

Proprio come gli LLM estraggono il testo per capire le relazioni tra le parole, l’algoritmo life2vec, alimentato con le storie di vita ricostituite dei 6 milioni di abitanti della Danimarca tra il 2008 e il 2015, ha estratto questi riassunti per relazioni simili.

Poi è arrivato il momento della resa dei conti: quanto bene avrebbe potuto applicare quella formazione approfondita per fare previsioni dal 2016 al 2020? Tra i test dell’algoritmo, i ricercatori hanno studiato un campione di 100.000 persone di età compresa tra 35 e 65 anni, metà delle quali sono sopravvissute e l’altra metà è morta durante quel periodo. Quando è stato chiesto di indovinare quali sono morti, life2vec ha indovinato il 79% delle volte (l’ipotesi casuale dà una percentuale di successo del 50%). Ha sovraperformato i successivi migliori modelli predittivi, ha affermato Lehmann, dell’11%.

Sebbene il documento affermi che “sono effettivamente possibili previsioni individuali accurate”, l’algoritmo fornisce una probabilità di morte per un certo periodo piuttosto che una data esatta. Ci sono però delle avvertenze: ciò che si applica in Danimarca potrebbe non applicarsi altrove, e l’algoritmo codifica i bias nei dati di addestramento. Anche così, dato il suo potenziale per ottimizzare la previsione del rischio, varrà la pena osservarne l’impatto sul settore assicurativo. Da parte loro, i ricercatori non vogliono che il loro lavoro venga utilizzato dagli assicuratori e per ora tengono nascosti l’algoritmo e i dati.

Ma più entusiasmante dei risultati, sottolineano i ricercatori, è che life2vec è generale e non specifico per un compito. Nei modelli predittivi esistenti, i ricercatori devono prespecificare le variabili che contano, come età, sesso e reddito. Al contrario, questo approccio fagocita tutti i dati e può basarsi indipendentemente su fattori rilevanti (ha notato che il reddito conta positivamente per la sopravvivenza, per esempio, e che una diagnosi di salute mentale conta negativamente). Ciò potrebbe indirizzare i ricercatori verso influenze sulla salute precedentemente inesplorate e potrebbe scoprire nuovi collegamenti tra modelli di comportamento apparentemente non correlati.

Una delle preoccupazioni crescenti di Lehmann è la privacy; sottolinea che aziende come Google stanno assemblando potenti macchine di previsione, utilizzando un’abbondanza di dati personali raccolti da Internet.

Questa è un’era di prevedibilità senza precedenti nella vita umana – e un’era di potere senza precedenti per coloro che possono leggere le nostre storie prima che le abbiamo vissute.