Lun. Mar 23rd, 2026
Andrew Barto and Richard Sutton

Rimani informato con aggiornamenti gratuiti

Due pionieri dell'apprendimento del rinforzo, una tecnica scientifica che è stata fondamentale per il boom dell'intelligenza artificiale, hanno messo in guardia dallo schieramento non sicuro dei modelli di intelligenza artificiale dopo aver vinto il premio Turing di quest'anno.

Andrew Barto, professore emerito presso l'Università del Massachusetts, e Richard Sutton, professore all'Università di Alberta ed ex ricercatore presso DeepMind, hanno vinto il premio da 1 milione di dollari dall'Associazione per le macchine informatiche per lo sviluppo del metodo rivoluzionario.

Barto e Sutton hanno sviluppato l'apprendimento di rinforzo negli anni '80 dopo essere stati ispirati dalla psicologia e dal modo in cui le persone imparano. La tecnica di apprendimento automatico, che premia i sistemi di intelligenza artificiale per comportarsi in modo desiderato, ha contribuito a alimentare il successo di alcuni dei migliori gruppi di intelligenza artificiale del mondo, come Openai e Google.

I vincitori del premio, che sono spesso soprannominati il ​​premio Nobel dell'informatica, hanno dichiarato di essere preoccupati per le aziende di intelligenza artificiale che si affrettano a lanciare prodotti prima di testarli a fondo.

“Rilasciare il software a milioni di persone senza salvaguardia non è una buona pratica ingegneristica”, ha detto Barto, paragonandolo a costruire un ponte e testarlo facendo sì che le persone lo usino.

“La pratica ingegneristica si è evoluta per cercare di mitigare le conseguenze negative della tecnologia e non vedo che fossero praticati dalle aziende che si stanno sviluppando”, ha aggiunto.

Il premio, che prende il nome dal matematico britannico Alan Turing, arriva dopo che le scoperte dell'IA sono state riconosciute anche in premi Nobel di chimica e fisica in ottobre. Ciò ha messo in evidenza l'importanza degli strumenti di elaborazione e della scienza dei dati nel cracking di complessi problemi scientifici in tempi molto più brevi.

“Gli strumenti [Barto and Sutton] Sviluppato rimane un pilastro centrale del boom dell'IA e hanno fatto grandi progressi, attirato legioni di giovani ricercatori e miliardi di dollari in investimenti. [Reinforcement learning’s] L'impatto continuerà bene nel futuro “, ha affermato Jeff Dean, vicepresidente senior di Google, che ha sponsorizzato il premio.

Google DeepMind ha usato la tecnica per sviluppare AlphaGo, un sistema di intelligenza artificiale che ha battuto i giocatori umani nel gioco, una pietra miliare nella ricerca sull'IA. Openi ha anche utilizzato un tipo di apprendimento di rinforzo che si basa sul feedback umano per controllare l'output di CHATGPT.

Ma sia Barto che Sutton hanno messo in guardia contro l'attuale ritmo dello sviluppo dell'IA, in cui le aziende stanno correndo per lanciare modelli potenti ma soggetti a commettere errori, aumentando quantità senza precedenti di finanziamenti e investimenti miliardi di infrastrutture come i data center per formare e gestire l'intelligenza artificiale.

I grandi gruppi tecnologici hanno affermato che la spesa AI potrebbe superare i $ 320 miliardi quest'anno, mentre Openai, che ha lanciato CHATGPT nel 2022, sta attualmente raccogliendo $ 40 miliardi in nuovi finanziamenti a una valutazione di $ 260.

Barto ha criticato il settore dell'IA per essere motivato da incentivi aziendali, invece di promuovere la ricerca dell'IA. “L'idea di avere enormi data center e quindi addebitare un certo importo per usare il software è motivazione delle cose, e questo non è il motivo a cui mi abbonerò”, ha aggiunto.

Openai ha sostenuto che deve sbloccare ulteriori investimenti attraverso una struttura aziendale più tradizionale al fine di raggiungere la “missione” fondatrice dell'azienda di garantire che l'intelligenza generale artificiale (AGI) – uno scenario in cui i sistemi informatici raggiungono livelli di intelligenza simili o superiori all'uomo – avvantaggia l'umanità.

Ma Sutton ha respinto la narrativa delle compagnie tecnologiche attorno ad AGI come “hype”. “AGI è un termine strano perché c'è sempre stato AI e le persone che cercano di capire l'intelligenza.” Ha aggiunto che “sistemi più intelligenti delle persone” avverranno alla fine attraverso una migliore comprensione della mente umana.

Barto e Sutton hanno anche criticato il tentativo del presidente americano Donald Trump di tagliare la spesa federale per la ricerca scientifica e licenziare il personale delle agenzie scientifiche statunitensi.

Ciò potrebbe avere conseguenze devastanti per il dominio degli Stati Uniti nella scienza, ha affermato Barto, che lo ha definito “sbagliato e una tragedia non solo in questo paese ma per il mondo”.

Ha aggiunto che le opportunità di fare il tipo di ricerca che hanno permesso il loro lavoro nell'apprendimento del rinforzo “scomparirebbe” senza la libertà di esplorare concetti astratti e non dimostrati.

Nonostante le loro preoccupazioni, entrambi gli scienziati sono ottimisti riguardo al potenziale per l'apprendimento del rinforzo, combinato con l'IA, di portare risultati positivi al mondo.

“Abbiamo il potenziale per diventare meno avidi ed egoisti e più consapevoli di ciò che sta accadendo negli altri. . . Ci sono molte cose sbagliate nel mondo, ma troppa intelligenza non è una di queste “, ha detto Sutton.