Di Juan Helios, da Nuevo Rumbo, organo del Partito Comunista dei Lavoratori di Spagna (PCTE)
26 marzo 2025
Link all’originale
Il 27 gennaio, durante la notte, NVIDIA, azienda leader nel design di schede grafiche, perde quasi 600 miliardi di euro sul mercato, pari al 17% del suo valore. Milioni di persone molto ricche si svegliano diventando un po’ meno ricche. Qual è la causa? Un articolo scientifico dell’azienda cinese DeepSeek dimostra che è in grado di allenare un modello di intelligenza artificiale che raggiunge lo stesso livello di prestazioni con un costo 100 volte inferiore a quello dell’ultimo modello della statunitense OpenAI. Inoltre, l’azienda cinese lancia il modello in modo aperto e disponibile a tutti, al contrario dei modelli di OpenAI, che di “open” hanno solo il nome. Con questo articolo scientifico, DeepSeek mette in discussione due assunti nel mondo dell’intelligenza artificiale: prima, la supremazia americana nell’IA; seconda, la necessità di maggiore capacità di calcolo, cioè di schede grafiche più potenti, per allenare i nuovi modelli di ragionamento che avevano cominciato ad essere pubblicati verso la fine del 2024.
Per comprendere questo terremoto e le sue profonde implicazioni nelle relazioni tra i blocchi imperialisti, bisogna risalire all’inizio del 2012, quando esplode la rivoluzione delle reti neurali artificiali profonde e, successivamente, quella dei primi modelli generativi di linguaggio. Questi modelli sono in grado di prevedere quale sarà la parola successiva più probabile a partire da un insieme di parole precedenti. Queste capacità predittive conferiscono loro alcune abilità nella risoluzione dei problemi, con il potenziale di automatizzare numerosi compiti. Ad esempio, immaginate un romanzo giallo in cui l’ultima parola dell’intera storia è il nome dell’assassino: la previsione corretta implica un certo grado di ragionamento. OpenAI è saltata alla ribalta grazie allo sviluppo di questo tipo di modelli, diventando leader nel campo dopo la pubblicazione di GPT-3 e siglando una alleanza strategica con Microsoft che ha fatto sì che i suoi modelli venissero incorporati in vari prodotti di questa compagnia.
Va ricordato, perché è facile dimenticarlo, che ogni sistema informatico funziona grazie ad un substrato fisico. Sebbene le reti neurali profonde fossero conosciute dagli anni ’60, il loro sviluppo massiccio è avvenuto a partire dal 2010, grazie al fatto che le schede grafiche, inizialmente progettate per software di simulazione e videogiochi, erano state sviluppate a sufficienza da poter allenare reti neurali con molti più parametri, ossia più grandi. L’azienda chiave in questo componente fisico dell’IA è NVIDIA, una corporation americana dedicata al design delle schede grafiche che si è impegnata molto per fare in modo che le sue schede fossero facilmente configurabili dai programmatori. I successi di NVIDIA hanno provocato una posizione praticamente monopolistica. A dimostrazione di ciò, tra il 2012 e il 2025, le azioni di NVIDIA sono aumentate del 40.881,25%. Questo aumento è stato correlato con lo sviluppo delle reti neurali profonde che, man mano che dimostravano la loro capacità di risolvere problemi nel riconoscimento di schemi, nella risoluzione di problemi e nella generazione di contenuti, hanno anche provocato un aumento della domanda di schede grafiche.
In questo contesto di modelli sempre più abili e della necessità di maggiore capacità di calcolo, e quindi di schede grafiche, nel 2024 nasce una nuova tecnica che rivoluziona nuovamente il paradigma dei modelli generativi. In sintesi, questa tecnica consiste nel fatto che quando si richiede una risposta al modello, sia ChatGPT, Gemini o DeepSeek, esso si prenda un “tempo extra” per riflettere sulla risposta. Ispirato da questa idea, OpenAI rilascia il suo primo modello di ragionamento o1 nel settembre del 2024, migliorando in modo radicale i punteggi in vari esami progettati per testare la capacità di ragionamento di queste intelligenze artificiali. Questo miglioramento ha un costo: un aumento generale del calcolo, per cui è necessario spendere molta più energia, acquistare più schede grafiche e, con ciò, più affari per NVIDIA. Se la via per un’IA più potente sarà sempre quella di effettuare calcoli più intensivi, chi produce le schede grafiche ha il futuro assicurato.
È qui che DeepSeek rompe gli schemi a gennaio. L’azienda cinese aveva già sviluppato modelli competitivi, ma inferiori a quelli di OpenAI, posizionandosi come un attore rilevante nel mondo dell’IA nell’ultimo anno. Lanciando il suo modello di ragionamento r1 e rivelando il suo prezzo e le sue capacità, simili a quelle del modello o1, è passata da attore rilevante a concorrente diretto. Il segreto del suo successo, lontano dalle accuse propagandistiche e tecnicamente stupide di copiare o usare risposte di ChatGPT per allenare il modello, sta nell’aver ottimizzato in modo brillante e altamente sofisticato il codice dell’IA, riuscendo così a fare di più con meno e, quindi, a ridurre i prezzi mantenendo le capacità. In questo modo dimostrano che quello di avere più schede grafiche più potenti non è l’unica strada, ma che esiste un ampio margine per l’ottimizzazione del codice, riducendo così le aspirazioni commerciali di NVIDIA.
Oltre al progresso tecnico, per la prima volta nello sviluppo di questo tipo di modelli è un team cinese a prendere la leadership. Inoltre, un team con pochi legami con l’esterno in termini di dipendenti formati negli Stati Uniti o in Europa e con finanziamenti esclusivamente cinesi. In questo modo, la Cina dimostra di essere in grado di sviluppare talento scientifico e tecnologico al livello dei suoi concorrenti senza passare per le istituzioni occidentali, un traguardo nella sua corsa per diventare la prima potenza mondiale che nessun altro dei cosiddetti paesi in via di sviluppo è riuscito ad eguagliare.
Questo successo della Cina rappresenta anche una crisi di fiducia nella strategia degli Stati Uniti nei confronti dell’intelligenza artificiale. Il governo di Biden ha imposto nel 2022 forti restrizioni all’export di schede grafiche NVIDIA verso la Cina per limitare il suo progresso tecnologico. Ciò ha fatto sì che i dubbi su come DeepSeek sia riuscita ad allenarsi nonostante queste restrizioni si siano intensificati: la Cina ha aggirato le restrizioni acquistando schede da Singapore? Queste restrizioni hanno spinto le aziende cinesi a ottimizzare al massimo queste schede? In ogni caso, si può dire che la strategia degli Stati Uniti di ostacolare il progresso dell’IA in Cina imponendo restrizioni non ha funzionato. Anzi, la messa a disposizione libera del modello da parte di DeepSeek in modo che possa essere utilizzato da chiunque minaccia direttamente la strategia commerciale di OpenAI, e con essa, una parte delle aziende i cui profitti dipendono dalla rendita tecnologica.
I magnati tecnologici degli Stati Uniti ottengono la maggior parte dei loro guadagni proteggendo la proprietà intellettuale e il loro status di monopolisti naturali, una situazione molto comune nel settore digitale. Se i modelli privati come Gemini di Google o ChatGPT di OpenAI fossero stati gli unici modelli di IA disponibili e di qualità superiore, questo permetteva loro di fissare facilmente le condizioni di vendita e di estrarre rendite da tutto il mondo tramite Internet. In questo modo, l’esistenza di un modello altrettanto valido come questi due, ma libero, che può essere eseguito nelle versioni più leggere su normali PC, mina la strategia di OpenAI e, quindi, le aspettative di guadagno dei suoi investitori. Così, la concorrenza libera comincia a diventare un problema quando il concorrente è il paese in corsa per il primo posto nella piramide imperialista, ed è qui che entrano in gioco lo Stato e la politica protezionista.
La vicinanza che hanno mostrato tutti i grandi imprenditori tecnologici a Trump durante e dopo la sua investitura non è stata casuale. In un contesto di maggiore competitività, dove la Cina è disposta a lottare per appropriarsi di parte delle rendite che vengono redirette da tutto il mondo verso gli Stati Uniti, la regolamentazione statale agisce come leva per contrastare gli effetti della concorrenza libera. Di conseguenza, durante quest’anno e nei prossimi, è possibile che vedremo continui appelli alla regolamentazione dell’intelligenza artificiale, a volte in forme piuttosto esoteriche, che avranno come sfondo questa intenzione di limitare la concorrenza libera. Questi appelli non saranno uniformi tra gli imprenditori, poiché esistono anche aziende come Meta che puntano su un’IA libera che garantisca una maggiore velocità di innovazione. Vedremo anche capacità maggiori nei nostri telefoni e computer per eseguire modelli di IA grazie alle ottimizzazioni promosse da tutti quei capitali che cercano di sfuggire dal rentismo nel cloud di Google o dalla dipendenza da NVIDIA. Sebbene possa sembrare contraddittorio, la posizione di NVIDIA sul mercato continuerà ad affermarsi e crescere, poiché se c’è qualcosa che il capitalismo dimostra è che ogni miglioramento nell’efficienza energetica serve ad aumentare il consumo nel lungo periodo.
Per concludere, questo conflitto crescente nelle tecnologie di IA tra gli Stati Uniti e la Cina non è altro che uno dei tanti campi di battaglia tra queste due potenze. Man mano che questa battaglia si intensifica, la Silicon Valley perde progressivamente il suo spirito idealizzato hippie, liberale e favorevole alla concorrenza, sostituendolo con il conservatorismo ideologico, il protezionismo e la regolazione del mercato. Quindi, non sorprenda se sempre più guru tecnologici sostituiscono le microdosi di LSD, comuni tra i programmatori di San Francisco, con le grandi messe evangeliche e l’odio verso le persone trans dei predicatori estremisti della Bible Belt.