Top 5 This Week

Articoli simili

DeepSeek: cos’è e come ha spaventato la Silicon Valley

DeepSeek è il modello di intelligenza artificiale cinese che a gennaio 2025 ha fatto tremare la Silicon Valley: in pochi giorni ha cancellato oltre 500 miliardi di dollari di capitalizzazione di mercato dalle aziende tech americane, ha mandato in crisi le azioni Nvidia e ha costretto OpenAI, Google e Anthropic a rivedere le proprie strategie. Non era la solita notizia tech: era un terremoto.

📌 In breve
DeepSeek è un’azienda cinese che ha sviluppato modelli AI di livello paragonabile a GPT-4 spendendo una frazione del costo di OpenAI. Il modello DeepSeek R1, rilasciato open source a gennaio 2025, ha ottenuto risultati eccellenti nei benchmark di ragionamento matematico e programmazione. La sua efficienza ha dimostrato che non servono miliardi di dollari e migliaia di chip Nvidia per creare AI di punta, ridisegnando le aspettative sull’intera industria.

Indice

  1. Cos’è DeepSeek e chi l’ha creato
  2. Perché ha spaventato la Silicon Valley
  3. Come funziona DeepSeek R1
  4. Il crollo di Nvidia e le conseguenze finanziarie
  5. DeepSeek vs ChatGPT: come si confrontano
  6. Le preoccupazioni sulla sicurezza e la censura
  7. Domande frequenti

Cos’è DeepSeek e chi l’ha creato

DeepSeek è un’azienda di intelligenza artificiale fondata nel 2023 a Hangzhou, in Cina, da Liang Wenfeng — anche fondatore del fondo speculativo High-Flyer Capital Management. Nasce come laboratorio di ricerca AI con una missione apparentemente semplice: costruire modelli linguistici di frontiera con risorse limitate. Il contesto è cruciale: le sanzioni americane sull’esportazione di chip avanzati in Cina avevano tagliato l’accesso alle GPU Nvidia H100, le più potenti disponibili per l’addestramento dei modelli AI.

Invece di fermarsi, DeepSeek ha sviluppato architetture innovative per fare di più con meno. Il risultato è stato una serie di modelli — DeepSeek-V2, DeepSeek-V3 e infine DeepSeek-R1 — che hanno raggiunto prestazioni competitive con i modelli americani di punta a una frazione del costo dichiarato. Quando DeepSeek ha rilasciato R1 come open source il 20 gennaio 2025, pubblicando contemporaneamente un paper tecnico dettagliato, la reazione del settore è stata immediata e violenta.

Perché ha spaventato la Silicon Valley

Il punto non era solo che DeepSeek funzionasse bene. Era quanto poco fosse costato costruirlo. DeepSeek ha dichiarato di aver addestrato il suo modello V3 con circa 6 milioni di dollari di compute, usando cluster di chip H800 (una versione ridotta dell’H100 esportabile in Cina). Per confronto, OpenAI ha speso miliardi per addestrare GPT-4, e Meta centinaia di milioni per Llama 3. Se i numeri dichiarati da DeepSeek erano accurati — e molti esperti ritengono che lo siano almeno in linea di massima — significava che tutto il settore stava costruendo sull’assunzione sbagliata che l’AI di frontiera richiedesse investimenti astronomici e accesso illimitato ai chip più potenti.

Questa assunzione era il fondamento dell’intera tesi di investimento di Nvidia. Se non servono decine di migliaia di H100 per addestrare modelli di qualità, la domanda futura di GPU potrebbe essere molto inferiore a quanto previsto. In un solo giorno, il 27 gennaio 2025, le azioni Nvidia sono crollate del 17%, cancellando circa 600 miliardi di dollari di capitalizzazione — il calo in un singolo giorno più grande della storia del mercato azionario americano per una singola azienda.

Ma l’impatto non si è limitato a Nvidia. Sono scese anche le azioni di Oracle, Microsoft, ASML e di tutti i fornitori dell’ecosistema AI americano. Il messaggio implicito era destabilizzante: la Cina, nonostante le sanzioni, aveva trovato il modo di competere nell’AI con risorse che il mercato aveva giudicato insufficienti.

Come funziona DeepSeek R1

DeepSeek R1 è un modello specializzato nel ragionamento, quello che in gergo tecnico si chiama “reasoning model”. A differenza dei modelli standard che generano risposte in modo diretto, R1 “pensa ad alta voce”: prima di dare una risposta, produce una catena di ragionamento — una serie di passaggi intermedi — che lo porta alla conclusione finale. Questa tecnica si chiama chain-of-thought e permette di risolvere problemi complessi di matematica, logica e programmazione in modo molto più accurato.

L’innovazione tecnica principale di DeepSeek riguarda l’architettura del modello e il processo di addestramento. DeepSeek ha usato una variante di tecniche di apprendimento per rinforzo (reinforcement learning) per insegnare al modello a ragionare, riducendo significativamente la quantità di dati etichettati da esseri umani normalmente necessari. Ha anche adottato un’architettura a Mixture of Experts (MoE) più efficiente: invece di attivare tutti i parametri del modello per ogni token, solo un sottoinsieme di “esperti” viene attivato a seconda del compito, riducendo il costo computazionale dell’inferenza.

Nei benchmark standard di matematica e coding — come AIME (problemi olimpici di matematica) e Codeforces — DeepSeek R1 ha ottenuto punteggi comparabili o superiori a OpenAI o1, il modello di ragionamento di punta di OpenAI al momento del rilascio.

Il crollo di Nvidia e le conseguenze finanziarie

Il lunedì nero del 27 gennaio 2025 è già entrato nella storia dei mercati finanziari. Prima dell’apertura dei mercati americani, DeepSeek aveva già scalato le classifiche dell’App Store, superando ChatGPT come app più scaricata negli Stati Uniti. Il segnale era chiaro: un modello cinese, economico da addestrare e disponibile gratuitamente, stava conquistando gli utenti americani.

Il calo di Nvidia è stato il più visibile, ma non il solo. L’intera tesi dell'”AI trade” — la scommessa che la corsa all’AI avrebbe alimentato una domanda insaziabile di infrastruttura hardware — veniva messa in discussione. Se un modello competitivo si poteva addestrare con una frazione delle risorse, forse la costruzione di mega-data-center da decine di miliardi di dollari era eccessiva. Microsoft, che aveva annunciato pochi giorni prima un piano di investimenti da 80 miliardi in infrastrutture AI, ha visto anche le sue azioni sotto pressione.

Le settimane successive hanno parzialmente recuperato le perdite, e molti analisti hanno ridimensionato l’impatto immediato: i chip Nvidia rimangono essenziali, e l’efficienza di DeepSeek potrebbe addirittura aumentare la domanda complessiva di compute attraverso l’effetto Jevons (se qualcosa diventa più economico, se ne usa di più). Ma il segnale strategico era indelebile.

DeepSeek vs ChatGPT: come si confrontano

Nella pratica quotidiana, DeepSeek R1 e ChatGPT-4o si comportano in modo diverso in base al tipo di compito. DeepSeek eccelle nei problemi di ragionamento strutturato — matematica, logica, codice — dove la sua capacità di mostrare il processo di pensiero lo rende trasparente e verificabile. ChatGPT è generalmente più fluido nelle conversazioni naturali, nella creatività e nella gestione di compiti sfumati che richiedono contesto culturale o senso comune.

In termini di accessibilità, DeepSeek ha un vantaggio di costo significativo. L’API di DeepSeek costa una frazione di quella di OpenAI — nell’ordine di 10-20 volte meno per token elaborato — rendendolo attraente per sviluppatori e aziende che costruiscono applicazioni AI. Il modello è anche scaricabile e usabile localmente (open weights), il che lo rende interessante per chi ha esigenze di privacy o vuole personalizzarlo.

Per un confronto con altri modelli AI disponibili in Italia, leggi anche la guida su Claude AI: cos’è e come funziona.

Le preoccupazioni sulla sicurezza e la censura

DeepSeek non è privo di controversie. Essendo sviluppato in Cina e soggetto alla legislazione cinese, il modello applica filtri di censura su determinati argomenti politicamente sensibili: domande su Tiananmen, Taiwan, Tibet o sulla leadership politica cinese ricevono risposte evasive o vengono rifiutate. Questo è in linea con la normativa cinese sull’AI, che impone ai modelli di rispettare i “valori socialisti fondamentali”.

Dal punto di vista della sicurezza informatica, diversi ricercatori hanno sollevato preoccupazioni riguardo alla raccolta dei dati degli utenti. L’app mobile di DeepSeek invia alcuni dati a server in Cina, un aspetto che ha portato diversi governi — tra cui l’Italia, l’Australia e alcuni paesi dell’UE — ad avviare indagini regolatorie o a vietare l’app sui dispositivi governativi. Il Garante Privacy italiano ha avviato un procedimento formale nei confronti di DeepSeek già nelle settimane successive al lancio.

Per uso personale tramite il sito web o l’API, queste preoccupazioni dipendono molto dal tipo di dati che si condivide. Per usi aziendali o con dati sensibili, la cautela è giustificata fino a quando il quadro regolatorio non sarà più chiaro.

Domande frequenti

DeepSeek è gratuito?

Il modello base è disponibile gratuitamente tramite il sito deepseek.com e l’app mobile. L’API ha un costo molto competitivo rispetto ai competitor americani. La versione open source (DeepSeek-R1 e V3) può essere scaricata e usata senza costi su hardware proprio.

È sicuro usare DeepSeek per dati personali o aziendali?

Con cautela. Come per qualsiasi servizio AI basato su cloud, i dati inseriti nelle conversazioni vengono elaborati sui server dell’azienda. Nel caso di DeepSeek, questi server si trovano in Cina e sono soggetti alla legislazione cinese. Per dati sensibili, personali o aziendali riservati, è prudente usare la versione self-hosted open source invece del servizio cloud.

DeepSeek ha davvero spaventato OpenAI?

Sì, nel senso che ha accelerato decisioni già in discussione. OpenAI ha risposto nei giorni successivi annunciando miglioramenti ai propri modelli e riducendo i prezzi dell’API. Sam Altman ha definito DeepSeek “impressionante” e ha ammesso che la competizione cinese è reale. L’effetto principale è stato un’accelerazione dell’intera industria verso modelli più efficienti.

DeepSeek continuerà a essere rilevante nel 2026?

DeepSeek ha rilasciato aggiornamenti continuativi dei suoi modelli e rimane uno dei laboratori AI più attivi al mondo. La sua importanza strategica va oltre i singoli benchmark: ha dimostrato che la competizione globale nell’AI è più aperta di quanto si credesse, e che l’efficienza computazionale è diventata la nuova frontiera della ricerca.

Più popolari