Le modèle d'IA étonnamment abordable de Deepseek défie les géants de l'industrie. La société prétend avoir formé son puissant réseau de neurones Deepseek V3 pour seulement 6 millions de dollars, utilisant seulement 2048 GPU, un contraste frappant avec les dépenses des concurrents. Cependant, ce chiffre ne reflète que les coûts de GPU avant la formation, en omettant des dépenses de recherche, de raffinement, de traitement des données et des infrastructures substantielles.
Image: esigame.com
La technologie innovante de Deepseek la distingue. Les caractéristiques clés incluent la prédiction multi-token (MTP) pour la prédiction des mots simultanée, le mélange d'experts (MOE) tirant parti de 256 réseaux neuronaux pour un traitement amélioré et une attention latente multi-tête (MLA) pour une meilleure extraction d'informations. Ces progrès contribuent à la précision et à l'efficacité du modèle.
Image: esigame.com
Contrairement au chiffre médical de 6 millions de dollars, la semianalyse révèle que Deepseek exploite une infrastructure massive d'environ 50 000 GPU Nvidia Hopper, d'une valeur d'environ 1,6 milliard de dollars, avec des coûts d'exploitation atteignant 944 millions de dollars. Cet investissement substantiel, associé à des salaires élevés pour ses chercheurs (dépassant 1,3 million de dollars par an), attire les meilleurs talents des universités chinoises. La nature autofinancée de l'entreprise et la structure rationalisée contribuent à son agilité et à son innovation rapide.
Image: esigame.com
Alors que la réclamation "adaptée au budget" de Deepseek est trompeuse, son investissement global de plus de 500 millions de dollars en développement de l'IA, combiné à ses percées techniques et à la main-d'œuvre qualifiée, lui permet de rivaliser efficacement. Une comparaison des coûts de formation souligne en outre ceci: le R1 de Deepseek coûte 5 millions de dollars, tandis que Chatgpt 4 aurait coûté 100 millions de dollars, démontrant un avantage significatif des coûts, même en considérant l'investissement réel de Deepseek.
Image: esigame.com
Le succès de Deepseek souligne le potentiel des entreprises d'IA indépendantes bien financées pour défier les joueurs établis. Cependant, ses réalisations sont enracinées dans des investissements substantiels, des progrès technologiques et une équipe hautement qualifiée, faisant du récit initial "à faible coût" une simplification à l'extérieur.