La startup cinese DeepSeek ha recentemente fatto scalpore nel settore dell’intelligenza artificiale introducendo modelli proprietari competitivi che eguagliano, e talvolta superano, soluzioni consolidate come ChatGPT e Gemini. Mentre l’attenzione globale è rivolta a questa innovazione, DeepSeek ha dovuto affrontare attacchi hacker ai suoi server, che tuttavia hanno resistito, sebbene con qualche rallentamento nel servizio. La startup ha lanciato Janus-Pro, una nuova famiglia di modelli AI multimodali open-source, disponibili su Hugging Face con licenza MIT, che consente utilizzi commerciali senza restrizioni.

Janus-Pro si distingue per la capacità di analizzare e generare immagini con prestazioni elevate, senza necessità di infrastrutture computazionali costose. Il modello più avanzato, Janus-Pro-7B, ha già ottenuto risultati promettenti in benchmark come GenEval e DPG-Bench, superando sistemi noti come DALL-E 3 e Stable Diffusion XL. Tuttavia, presenta ancora limitazioni, inclusa la capacità di caricare solo immagini di piccole dimensioni e output limitati.

L’entrata di DeepSeek nel mercato ha avuto importanti ripercussioni finanziarie, contribuendo al crollo della capitalizzazione di mercato di NVIDIA, evidenziando come i progressi nell’AI generativa open-source stiano cambiando il panorama economico. Inoltre, DeepSeek ha registrato un aumento significativo di download sull’App Store di Apple, causando congestioni ai server. L’azienda offre ai consumatori semplicità, flessibilità ed efficienza, suggerendo che il futuro dell’AI potrebbe non essere più dominato solo da multinazionali occidentali, ma anche da nuovi attori pronti a innovare.