Sblocca gratuitamente il Digest dell’editore
C’è voluto un anno, ma Google ha finalmente fornito una risposta coerente alla sfida a sorpresa al suo dominio nel campo dell’intelligenza artificiale arrivata con il lancio di ChatGPT.
Il rilascio di questa settimana di Gemini, una famiglia di modelli linguistici di grandi dimensioni, fornirà una piattaforma più forte per combattere sia OpenAI, la società dietro ChatGPT, sia Microsoft, che quest’anno ha utilizzato i modelli OpenAI per potenziare tutti i suoi software e servizi cloud.
La domanda ora è se Gemini può fare una differenza significativa per i servizi esistenti di Google e, cosa forse ancora più importante, se può diventare la base per una nuova gamma di servizi che portano l’intelligenza artificiale molto più in profondità nella vita di tutti i giorni.
Con i tre “sapori” di Gemini annunciati questa settimana, Google sta finalmente lasciando il segno su una tecnologia che i suoi stessi ricercatori hanno fatto molto per aprire la strada, ma che ChatGPT di OpenAI ha portato nel mainstream. La versione Pro, ad esempio, è posizionata esattamente contro GPT-3.5 di OpenAI, il modello dietro la versione gratuita di ChatGPT e il cavallo di battaglia per molte delle prime applicazioni di intelligenza artificiale generativa di altre aziende che sono arrivate sul mercato quest’anno.
Il più piccolo Gemini Nano è confrontato con sistemi come la versione più piccola di LLaMa 2, il modello open source di Facebook, rendendolo in grado di essere eseguito su un dispositivo mobile. Apple, come sempre, sta adottando un approccio ponderato prima di portare l’intelligenza artificiale generativa su iPhone, ma la comparsa di Gemini sull’ultimo telefono Pixel di Google è un segno che non può permettersi di aspettare troppo a lungo.
È il Gemini Ultra top di gamma, in uscita all’inizio del prossimo anno, a portare con sé le principali speranze di Google di eguagliare o superare il GPT-4 di OpenAI nella corsa per trasformare l’intelligenza artificiale generativa in uno strumento quotidiano più utile. L’azienda è rimasta indietro quest’anno, ma presenta alcuni chiari vantaggi che potrebbero aiutare a portare Gemini su un grande mercato nel 2024.
Uno è la distribuzione. Google ha dichiarato questa settimana, ad esempio, che Gemini verrà aggiunto a Chrome, che detiene oltre il 60% del mercato dei browser, offrendo a miliardi di utenti web accesso immediato a strumenti in grado di fare cose come analizzare il contenuto del web pagine.
Mentre Google sfrutta in questo modo il suo attuale potere di mercato per incrementare le sue ambizioni in materia di intelligenza artificiale, le autorità di regolamentazione della concorrenza osserveranno da vicino.
Un altro vantaggio per Google è l’incertezza attorno a OpenAI. Dopo lo scioccante licenziamento e la reintegrazione dell’amministratore delegato Sam Altman il mese scorso, le numerose aziende che hanno costruito i propri piani di intelligenza artificiale generativa sui modelli di OpenAI cercheranno di coprire le proprie scommesse.
La società di ricerca spera anche che il suo chatbot Bard faccia un lavoro migliore nel rivaleggiare con ChatGPT ora che ha alle spalle un modello linguistico migliore. Ma la sua migliore speranza di riconquistare un vantaggio potrebbe risiedere nell’essere il primo a proporre i prossimi servizi rivoluzionari basati sull’intelligenza artificiale generativa. Alcune delle funzionalità rivendicate per Gemini indicano dove Google pensa che potrebbero trovarsi.
Ha dato molta importanza, ad esempio, al fatto che Gemini è stato progettato fin dall’inizio per essere “multimodale”, ovvero in grado di comprendere non solo testo ma anche immagini, video e audio. Secondo Google, ciò lo rende più adatto rispetto a modelli come GPT-4 per affrontare il tipo di situazioni quotidiane che si basano su sensi come la vista e l’udito.
Questo potrebbe essere un passo verso sistemi di intelligenza artificiale in grado di operare meglio nel mondo reale. Ma è troppo presto per dire quali applicazioni ciò potrebbe rendere possibili o se Google abbia davvero raggiunto la superiorità tecnica che afferma.
Un’altra strada per lo sviluppo risiede in quelle che Google afferma siano le capacità di ragionamento e di pianificazione di Gemini. Questo è il tipo di competenze che potrebbero preparare il terreno per assistenti personali in grado di affrontare problemi complessi e stabilire un piano d’azione.
Se tali assistenti fossero collegati ad altri servizi Internet, potrebbero anche diventare agenti, agendo per conto dei loro utenti. Immagina un agente degli acquisti, ad esempio, che non solo cerca i prodotti che desideri, ma va avanti e li paga anche.
Questa si preannuncia già come una delle battaglie chiave dell’IA del 2024 e oltre. OpenAI ha fatto un primo passo in questa direzione il mese scorso quando ha affermato che i suoi utenti sarebbero stati in grado di costruire agenti rudimentali sui suoi modelli, per poi offrirli in vendita su un app store OpenAI. Ciò potrebbe indicare la prossima grande svolta nell’intelligenza artificiale oltre ChatGPT – e questa volta Google non ha intenzione di rimanere indietro.
