Il modello AI sorprendentemente conveniente di Deepseek sfida i giganti del settore. La società afferma di aver formato la sua potente rete neurale di DeepSeek V3 per soli $ 6 milioni, utilizzando solo 2048 GPU, un netto contrasto con le spese dei concorrenti. Tuttavia, questa cifra riflette solo i costi della GPU pre-allenamento, omettendo sostanziali ricerche, raffinamento, elaborazione dei dati e spese di infrastruttura.
Immagine: Ensigame.com
La tecnologia innovativa di Deepseek la distingue. Le caratteristiche chiave includono la previsione multi-token (MTP) per la previsione di parole simultanee, la miscela di esperti (MOE) sfruttando 256 reti neurali per l'elaborazione migliorata e l'attenzione latente multi-testa (MLA) per una migliore estrazione di informazioni. Questi progressi contribuiscono all'accuratezza e all'efficienza del modello.
Immagine: Ensigame.com
Contrariamente alla cifra pubblicizzata di $ 6 milioni, la seminalisi rivela che DeepSeek gestisce una massiccia infrastruttura di circa 50.000 GPU di Nvidia Hopper, valutate a circa $ 1,6 miliardi, con costi operativi che hanno raggiunto $ 944 milioni. Questo investimento sostanziale, unito ad alti salari per i suoi ricercatori (che superano l'anno di $ 1,3 milioni all'anno), attira i migliori talenti dalle università cinesi. La natura autofinanziata dell'azienda e la struttura aerodinamica contribuiscono alla sua agilità e rapida innovazione.
Immagine: Ensigame.com
Mentre l'affermazione "economica" di Deepseek è fuorviante, il suo investimento complessivo di oltre 500 milioni di dollari nello sviluppo dell'IA, combinato con le sue scoperte tecniche e la forza lavoro qualificata, gli consente di competere in modo efficace. Un confronto tra i costi di formazione evidenzia ulteriormente questo: R1 di DeepSeek costano $ 5 milioni, mentre secondo quanto riferito CHATGPT 4 costò $ 100 milioni, dimostrando un vantaggio significativo in termini di costi, anche considerando l'investimento effettivo di Deepseek.
Immagine: Ensigame.com
Il successo di Deepseek sottolinea il potenziale di società di intelligenza artificiale ben finanziate e indipendenti per sfidare i giocatori affermati. Tuttavia, i suoi risultati sono radicati in investimenti sostanziali, progressi tecnologici e un team altamente qualificato, rendendo la narrativa iniziale "a basso costo" una semplificazione eccessiva.