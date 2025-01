Il chatbot di intelligenza artificiale DeepSeek-R1, sviluppato in Cina, ha attirato l’attenzione globale per le sue avanzate capacità di ragionamento e per il suo modello open source. Lanciato recentemente, DeepSeek-R1 supporta diverse lingue, inclusa l’italiano, sebbene con alcune limitazioni. Questo modello è stato creato dalla startup DeepSeek, fondata nel 2023 da Liang Wenfeng, con l’obiettivo di sviluppare un’intelligenza artificiale generale, puntando a un’ottimizzazione delle risorse di calcolo. A differenza di modelli come quelli di Google e Meta, DeepSeek-R1 utilizza la tecnologia Multi-head Latent Attention, riducendo il consumo di memoria del 40%, e un’architettura Mixture-of-Experts, attivando solo alcuni dei suoi 671 miliardi di parametri per ogni input. Questa architettura consente di mantenere costi di calcolo più contenuti, mentre l’addestramento avviene tramite reinforcement learning.

DeepSeek-R1, con un costo di addestramento di circa 15 milioni di dollari, offre versioni “distillate” del modello, rendendolo accessibile anche su dispositivi meno potenti. Disponibile con licenza open source MIT, il chatbot può essere provato su www.deepseek.com o tramite piattaforme come Ollama, ma la qualità delle risposte in italiano è inferiore rispetto a quella in altre lingue. Tuttavia, la gestione dei dati degli utenti presenta preoccupazioni riguardo alla privacy e alla protezione delle informazioni personali. Inoltre, DeepSeek-R1 riflette i valori del socialismo cinese, censurando argomenti sensibili come la Piazza Tienanmen e l’autonomia di Taiwan. Ciò solleva interrogativi sull’obiettività dell’intelligenza artificiale e sul rischio di manipolazione delle informazioni.