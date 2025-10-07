23 C
DeepSeek R1: Rivoluzione cinese nei modelli linguistici AI

Nel 2025, la rivista Nature ha pubblicato la prima peer review di un modello linguistico di grandi dimensioni, chiamato DeepSeek R1. Questo modello è stato sviluppato a Hangzhou dalla compagnia cinese DeepSeek-AI, che ha deciso di rendere disponibili solo i pesi del modello, senza divulgare il codice sorgente o i dataset utilizzati per il suo addestramento. Questo approccio “open-weight” permette a ricercatori e sviluppatori di utilizzare il modello, pur limitando la trasparenza sui dati originari.

La peer review di DeepSeek R1 segna un cambiamento nelle pratiche delle grandi aziende tecnologiche, che spesso pubblicano i propri modelli senza verifica esterna. Nessun altro modello diffuso, come GPT o Claude, ha ricevuto una revisione formale. Il modello si distingue per l’uso avanzato del reinforcement learning, consentendo al sistema di “ragionare” autonomamente attraverso prove e penalizzazioni. Utilizza l’algoritmo proprietario Group Relative Policy Optimization (GRPO), che ha ridotto significativamente i costi di addestramento, rendendo il processo più economico rispetto agli investimenti di altre aziende.

Il percorso di sviluppo di DeepSeek R1 include due fasi principali. Il primo stadio, DeepSeek-R1-Zero, ha utilizzato solo regole basilari per costruire il ragionamento. Durante l’addestramento, il modello ha iniziato a pensare in modo più lungo, producendo risposte più dettagliate. Questo ha portato a un miglioramento drastico delle performance, superando anche il livello medio umano in vari test.

Tuttavia, permangono dubbi riguardo alla trasparenza dei dati e alla sicurezza del modello. Alcuni esperti hanno sollevato preoccupazioni circa la possibilità che i modelli open-weight possano essere facilmente manipolati o utilizzati male. L’esperimento di DeepSeek potrebbe spingere il settore a stabilire standard di valutazione più rigorosi e a promuovere una maggiore responsabilità nell’affermazione delle performance dei modelli AI.

