De diepe betaalbare AI -model van Deepseek daagt industriële reuzen uit. Het bedrijf beweert zijn krachtige Deepseek V3 -neurale netwerk te hebben getraind voor slechts $ 6 miljoen, met slechts 2048 GPU's, een schril contrast met de uitgaven van concurrenten. Dit cijfer weerspiegelt echter alleen PRPU-kosten voor de training, waardoor substantieel onderzoek, verfijning, gegevensverwerking en infrastructuurkosten worden weggelaten.
afbeelding: ensigame.com
De innovatieve technologie van Deepseek onderscheidt het. Belangrijkste kenmerken zijn onder meer multi-token voorspelling (MTP) voor gelijktijdige woordvoorspelling, mengsel van experts (MOE) die 256 neurale netwerken voor verbeterde verwerking gebruiken, en multi-head latente aandacht (MLA) voor verbeterde informatie-extractie. Deze vorderingen dragen bij aan de nauwkeurigheid en efficiëntie van het model.
afbeelding: ensigame.com
In tegenstelling tot het gepubliceerde cijfer van $ 6 miljoen, onthult Semianalysis dat Deepseek een massale infrastructuur van ongeveer 50.000 NVIDIA -hopper GPU's heeft, met een waarde van ongeveer $ 1,6 miljard, met operationele kosten tot $ 944 miljoen. Deze substantiële investering, in combinatie met hoge salarissen voor zijn onderzoekers (meer dan $ 1,3 miljoen per jaar), trekt toptalent van Chinese universiteiten aan. De zelf gefinancierde aard en gestroomlijnde structuur van het bedrijf dragen bij aan zijn behendigheid en snelle innovatie.
afbeelding: ensigame.com
Hoewel de "budgetvriendelijke" claim van Deepseek misleidend is, kan de algehele investering van meer dan $ 500 miljoen in AI-ontwikkeling, gecombineerd met zijn technische doorbraken en bekwame personeelsbestand, het effectief concurreren. Een vergelijking van trainingskosten benadrukt dit verder: de R1 van Deepseek kost $ 5 miljoen, terwijl CHATGPT 4 naar verluidt $ 100 miljoen kostte, wat een aanzienlijk kostenvoordeel aantoont, zelfs gezien de werkelijke investering van Deepseek.
afbeelding: ensigame.com
Het succes van Deepseek onderstreept het potentieel van goed gefinancierde, onafhankelijke AI-bedrijven om gevestigde spelers uit te dagen. De prestaties ervan zijn echter geworteld in substantiële investeringen, technologische vooruitgang en een zeer bekwaam team, waardoor het initiële "goedkope" verhaal een te vereenvoudigen is.