7 min read

DeepSeek: le implicazioni della rivoluzione AI per le crypto

Di Davide Grammatica

Cosa ha a che fare DeepSeek con le criptovalute? Direttamente nulla, ma la sua “rivoluzione” tecnologica è decisiva, anche per le crypto

L’avvento di DeepSeek sconvolge il mercato

Da un giorno all’altro, il settore AI è stato ribaltato. Ci ha pensato una startup cinese di nome DeepSeek, riuscita a entrare in competizione con i colossi tecnologici americani nel campo tecnologico di maggiore prospettiva in questo preciso momento storico.

Ce l’ha fatta introducendo un cambio di paradigma nell’approccio ai tradizionali modelli di intelligenza artificiale, che ha permesso a DeepSeek di ottenere gli stessi risultati di OpenAI con una frazione molto più piccola dell’hardware che sarebbe dovuto essere necessario, e quindi con costi estremamente ridotti.

In più, ha svelato un conflitto Usa-Cina anche sul terreno dell’innovazione, per una corsa all’AI che si sta svolgendo su un terreno sempre più pieno di ostacoli, tra ricerca di materie prime e dazi commerciali.

Le criptovalute hanno reagito, così come tutto il mercato azionario, negativamente alle novità introdotte da DeepSeek. Tra i titoli tecnologici, Nvidia ha perso addirittura il 17% in una sola giornata.

A lungo termine, tuttavia, non si esclude che proprio DeepSeek gioverà a tutto il settore AI: una tecnologia più “economica” non può che portare benefici, e anche il mondo crypto potrebbe raccoglierne i frutti.

Questo focus on è stato pubblicato in esclusiva sulla nostra newsletter settimanale Whale Weekend, dove in una manciata di minuti di lettura ti raccontiamo i fatti più importanti della settimana crypto, economica e finanziaria: iscriviti subito!

Indice

Le preoccupazioni delle big tech Usa
La lotta per il “primato” tecnologico
Alcuni problemi di DeepSeek
La svolta tecnologica di DeepSeek
Tecnicismi

Le preoccupazioni delle big tech Usa

A inizio settimana, Bitcoin è crollato del 6% in poche ore in risposta alle difficoltà del mercato azionario. Alcuni punti di riferimento del settore, come Marc Andreessen, hanno parlato dell’avvento di DeepSeek come del “momento Sputnik” dell’AI, una svolta storica che non poteva passare inosservata, e che anticipa una sorta di Guerra Fredda 2.0 “tecnologica” tra Usa e Cina.

Le preoccupazioni sono nate dalla constatazione che la Cina ha potuto creare un modello in grado di competere sullo stesso terreno dei grandi colossi tecnologici americani, ma con costi operativi estremamente ridotti.

Si parla di costi nell’ordine di milioni di dollari (esclusi quelli hardware) per eseguire le stesse operazioni, a fronte di miliardi ritenuti fino a qualche settimana necessari.

Apple, Nvidia, Tesla, Microsoft, Amazon, Meta e Alphabet hanno reagito al ribasso, con perdite sostanziali sul mercato. Nvidia è arrivata addirittura a perdere il 17% in una singola giornata. Hanno sofferto anche le maggiori utilities energetiche, poiché influenzate dai ricavi derivanti modelli di elaborazione più “voraci”, come quelli di ChatGPT.

Le criptovalute, come anticipato, hanno subito l’effetto indiretto delle preoccupazioni degli investitori, dimostrando quindi di essere soggette alle forze del mercato più ampio e, in sostanza, dalla finanza tradizionale.

La lotta per il “primato” tecnologico

Uno dei temi più rilevanti riguarda lo squarcio della narrativa secondo la quale gli Usa avessero il “primato” sul settore AI. Un dominio incontrastato e, di fatto, incontrastabile, poiché forte di investimenti monstre che sembravano precludere la partecipazione di altri attori fuori dalla cerchia delle big tech.

A questa narrazione ha partecipato direttamente Donald Trump, che pochi giorni prima aveva annunciato un piano di investimento da 500 miliardi di dollari nel settore per garantire agli Usa il dominio sul settore.

Anche per questa ragione, il mondo crypto ha seguito da vicino i movimenti del mercato azionario, poiché anch’esso ormai parte della strategia del nuovo presidente. Si ricordano molto bene, infatti, le dichiarazioni di Trump rispetto al far diventare gli Usa la “capitale delle crypto e dell’intelligenza artificiale”.

“La forte correlazione tra bitcoin e azioni, soprattutto nel trimestre in corso, rimane una delle dinamiche di mercato più affidabili”, di legge in una nota di BitMEX.

I prezzi si sono comunque stabilizzati nei giorni successivi, e proprio la resilienza del settore lascia intendere che le prospettive possano essere comunque rialziste. Il fatto che Bitcoin abbia recuperato in fretta il livello psicologico fondamentale dei $100k, infatti, denota come il settore non abbia risentito di questa svolta nei suoi fondamentali, a differenza di quanto succede ancora ora per il Nasdaq.

Lascia ben sperare, nel lungo termine, il fatto che DeepSeek sia open source, e che quindi possa comunque portare dei benefici anche nell’industria americana. Un’AI più “economica”, di per sé, non può essere una brutta notizia.

Alcuni problemi di DeepSeek

L’entusiasmo intorno alla startup cinese potrebbe essere mitigato da alcuni problemi realativi alla privacy e, in un certo senso, all’etica. L’atteggiamento dei regolatori americani rispetto alle app cinesi si è già mostrato nel caso TikTok, e in questo senso DeepSeek non rimanere a lungo nel mercato americano.

Per alcuni di questi, l’app sarebbe uno dei tanti “cavalli di Troia” per mettere le mani sui dati degli utenti americani, e per questo sarebbe da combattere.

The U.S. is in an economic war with China—whether you see it or not. Deepseek AI isn’t some scrappy startup story; it’s a state-sponsored power play using black-market chips to dominate AI.

China has a pattern—TikTok, Lemon8, Mao’s Little Red Book—all Trojan horses for data… pic.twitter.com/RRp7jiCHUm

— Kevin O’Leary aka Mr. Wonderful (@kevinolearytv) January 29, 2025

Ne sappiamo qualcosa anche noi italiani, in quanto nel nostro paese è già intervenuto il garante della privacy a tutela dei consumatori, indagando sulla gestione dei dati da parte della società.

È famosa, inoltre, la risposta di DeepSeek in merito a argomenti politicamente sensibili per il Partito Comunista Cinese, come i casi Piazza Tienanmen o Taiwan. Rispetto a questi, la censura sembra essere applicata arbitrariamente, ma in un modo facilmente “bypassabile”. Essendo open source, infatti, anche temi sensibili come questi possono essere descritti dall’AI cercando di forzare il “blocco” tramite domande più specifiche.

La svolta tecnologica di DeepSeek

Il “modello cinese” è riuscito a quagliare il miglior LLM di OpenAI e quello di Anthropic con una frazione molto piccola dell’hardware che sarebbe dovuto essere necessario.

Tralasciando i tecnicismi, basti sapere che l’addestramento dell’AI da parte di DeepSeek è stato eseguito tramite tecniche completamente diverse da quelle utilizzate dagli sviluppatori americani.

Per certi versi, proprio i grandi investimenti non avrebbero permesso agli attori americani di trovare soluzioni più efficienti, poiché i fondi per ottenere hardware abbastanza performanti si sono sempre trovati.

Clearly you don’t understand OpenAI needs billions of dollars of hardware to answer the same question the DeepSeek can answer on your home computer without an internet connection.

It literally costs 97% less per query. pic.twitter.com/EBc0dHjaru

— Financelot (@FinanceLancelot) January 26, 2025

DeepSeek, per dare una misura del cambio di prospettive, avrebbe sviluppato (tra gli altri) un sistema “multi-token”, che elabora frasi intere contemporaneamente anziché singole parole, e questo ha reso il sistema molto più veloce mantenendo un accuratezza giudicata sufficiente.

Gli esperti palano di un passaggio da un modello LLM (modello linguistico di grandi dimensioni) a uno SLM (di piccole dimensioni), che richiederebbe pochi calcoli e quindi una più semplice esecuzione su macchine più “deboli” come gli smartphone.

Tecnicismi

Per volesse andare un po’ più nello specifico…

La rivoluzione di DeepSeek non consiste tanto nell’aver “pareggiato” i conti con il “generative pre-trained transformer” (GPT) OpenAI o1, e nell’essere open source, ma nel metodo utilizzato per arrivare a questo risultato.

Parliamo quindi di DeepSeek R1, e dell’idea di passare da un modello LLM a uno di “ragionamento”, che sfrutta quindi il CoT (“Chain of thought prompting”).

DeepSeek R1 ha dimostrato di poter “imparare a ragionare” quasi esclusivamente da solo, sfruttando la tecnica di “Reinforcement learning” (RL).

A differenza di OpenAI, che elabora delle direttive molto precise nell’esecuzione del CoT, DeepSeek si appoggia in larga parte sul RL, e le modalità sono tutte pubbliche (essendo open source). Solo grazie a questo, le API sono rese estremamente più economiche di quelle di OpenAI, nell’ordine delle 30 volte per costo “input/output”.

Per descrivere le novità introdotte da DeepSeek occorre però fare un passo indietro, a GPT-4 di OpenAI, il classico Large Language Model (LLM). Questa è una macchina “allenata” per generare testi in più fasi.

La prima è quella del pre-training, in cui impara “completare” dei testi che le vengono sottoposti (senza capacità discorsiva).
La seconda è quella del supervised fine-tuning, in cui degli operatori umani sottopongono dei problemi da risolvere alla macchina.
Infine c’è la fase di alignment, in cui i prompt e le risposte vengono “giudicati” da terze parti o, più comunemente, dal RLHF (Reinforcement learning with human feedback). A questa fase può essere aggiunto un RL su CoT, in parole povere, “catene di pensiero” o “piccoli passi” per generare risposte ancora migliori.

Non essendo open source, non si conoscono i dettagli del procedimento adottato da OpenAI in merito al RL. Ci sono però delle ipotesi, e queste portano a pensare a un meccanismo “process & reward”. Questo “valuta” le risposte e il processo utilizzato per sviluppare queste ultime, migliorando quindi le prestazioni della rete.

DeepSeek utilizza sostanzialmente gli stessi elementi, ma con qualche differenza. La principale: dopo la fase di pre-training, non c’è quella del supervised fine-tuning, e si passa subito a quella di RL su CoT, con meccanismo di “process & reward”.

Si “skippa” un’intera fase, con quella del supervised fine-tuning limitata a piccoli “esempi” specifici prima e dopo la fase di RL.

In un certo senso, DeepSeek R1 “impara da solo”, con un input che viene elaborato più e più volte dalla rete per risultati sempre migliori grazie al processo di CoT e dal meccanismo di reward.

Si può vedere, concretamente, nel procedimento di risposta ad alcune domande. Non è raro, per esempio, che DeepSeek possa elaborare una risposta e, prima di concluderla, si fermi un attimo, si accorga di aver “imparato” qualcosa, e rielabori una risposta migliore.