Sab. Set 14th, 2024
I concorrenti dei chip cercano di rompere la presa di Nvidia sul mercato dell'intelligenza artificiale

Rimani informato con aggiornamenti gratuiti

I rivali di Nvidia si stanno mobilitando nel tentativo di spezzare la morsa dell'azienda sul mercato dei chip per l'intelligenza artificiale, raccogliendo centinaia di milioni di dollari e lanciando nuovi prodotti, nel tentativo di spartirsi i frutti del boom della tecnologia dell'intelligenza artificiale.

Cerebras, d-Matrix e Groq fanno parte di un gruppo di aziende più piccole che mirano a strappare una fetta del mercato multimiliardario dei chip per l'intelligenza artificiale a Nvidia, che finora ha dominato la prima ondata di investimenti con le sue unità di elaborazione grafica, o GPU.

Stanno cavalcando l'onda dell'aspettativa che la domanda di “inferenza” dell'intelligenza artificiale (la potenza di calcolo necessaria a modelli come ChatGPT di OpenAI e Gemini di Google per generare risposte alle query) crescerà in modo esponenziale man mano che i chatbot e altre applicazioni di intelligenza artificiale generativa diventeranno più popolari.

Le GPU Hopper di Nvidia, particolarmente adatte al compito altamente dispendioso in termini di risorse di addestrare i migliori modelli di intelligenza artificiale, sono diventate uno dei prodotti più richiesti al mondo.

Cerebras, d-Matrix e Groq si stanno invece concentrando su chip più economici e specializzati, progettati per l'esecuzione di modelli di intelligenza artificiale.

Martedì Cerebras ha annunciato la sua nuova piattaforma “Cerebras Inference”, basata sul suo chip CS-3, che ha le dimensioni di un piatto da portata. Cerebras afferma che la sua soluzione è 20 volte più veloce dell'attuale generazione di chip Hopper di Nvidia nell'inferenza AI, a una frazione del prezzo. Cerebras cita test eseguiti dal fornitore di analisi di benchmarking Artificial Analysis.

“Il modo per battere il gorilla da 800 libbre è portare sul mercato un prodotto decisamente migliore”, ha detto al MagicTech l'amministratore delegato di Cerebras Andrew Feldman. “Nella mia esperienza, di solito vincono i prodotti migliori e abbiamo preso clienti significativi da [Nvidia].”

Il chip CS-3 evita l'uso di un chip di memoria separato ad alta larghezza di banda, utilizzato da Nvidia. Offre invece un'architettura alternativa con memoria integrata direttamente nel wafer del chip.

Le limitazioni sulla larghezza di banda della memoria, ha detto Feldman, sono un vincolo fondamentale sulla velocità di inferenza di un chip AI. La combinazione di logica e memoria in un singolo chip di grandi dimensioni fornisce risultati che sono “ordini di grandezza più veloci”, ha detto.

d-Matrix, fondata da Sid Sheth nel 2019, sta anche dando il via a un nuovo round di finanziamenti a meno di un anno dalla raccolta di 110 milioni di $ in un round di finanziamenti di serie B guidato dal fondo statale di Singapore Temasek. L'azienda punta a raccogliere 200 milioni di $ o più entro la fine dell'anno o all'inizio del prossimo, secondo Sheth. d-Matrix è all'inizio del processo di raccolta fondi e ha affermato che la cifra finale raccolta potrebbe cambiare.

d-Matrix sta pianificando un lancio su larga scala della sua piattaforma di chip, Corsair, alla fine di quest'anno. Sheth ha detto che l'azienda stava abbinando i suoi prodotti a software aperti come Triton, che compete con Cuda di Nvidia, una piattaforma software ampiamente utilizzata che offre agli sviluppatori gli strumenti per creare applicazioni AI e ottimizza le prestazioni dei suoi chip.

I clienti più importanti di Nvidia stanno sostenendo l'uso di software open source come Triton. “Gli sviluppatori di app non amano essere vincolati a un particolare strumento”, ha affermato Sheth, e “le persone stanno diventando consapevoli che Nvidia ha una presa soffocante su Cuda sul lato della formazione”.

Groq, un altro concorrente nell'inferenza AI guidato da un ex membro fondatore del team dell'unità di elaborazione tensoriale di Google, ha raccolto 640 milioni di dollari questo mese da investitori guidati da BlackRock Private Equity Partners, per una valutazione di 2,8 miliardi di dollari.

Un investitore di capitale di rischio ha sottolineato che, nonostante l'entusiasmo che circonda il settore, le start-up di semiconduttori hanno avuto difficoltà a entrare nel mercato.

Secondo fonti a conoscenza dell'accordo, il produttore di chip Graphcore è stato acquistato da SoftBank il mese scorso per poco più di 600 milioni di dollari, una cifra inferiore ai circa 700 milioni di dollari che la società aveva raccolto in capitale di rischio dalla sua fondazione nel 2016.

Groq e Cerebras sono state fondate anch'esse nel 2016. “C'è stato un desiderio quasi insaziabile da parte degli investitori pubblici di trovare e sostenere la prossima Nvidia”, ha affermato Peter Hébert, co-fondatore e managing partner della società di venture capital Lux Capital. “Non si tratta solo di inseguire l'ultima tendenza. Lo slancio sta anche beneficiando diverse start-up di chip finanziate da VC che hanno lavorato duramente per quasi un decennio”.