Ang nakakagulat na Deepseek ay nakakagulat na mga hamon sa modelo ng AI na mga higante sa industriya. Inaangkin ng kumpanya na sinanay ang malakas na deepseek V3 neural network para sa isang $ 6 milyon lamang, na gumagamit lamang ng 2048 GPU, isang kaibahan sa paggasta ng mga kakumpitensya. Gayunpaman, ang figure na ito ay sumasalamin lamang sa mga gastos sa pre-training GPU, pagtanggal ng malaking pananaliksik, pagpipino, pagproseso ng data, at mga gastos sa imprastraktura.
Imahe: ensigame.com
Ang makabagong teknolohiya ng Deepseek ay nakikilala ito. Kasama sa mga pangunahing tampok ang multi-token prediction (MTP) para sa sabay-sabay na hula ng salita, pinaghalong mga eksperto (MOE) na gumagamit ng 256 neural network para sa pinahusay na pagproseso, at multi-head latent attention (MLA) para sa pinahusay na pagkuha ng impormasyon. Ang mga pagsulong na ito ay nag -aambag sa kawastuhan at kahusayan ng modelo.
Imahe: ensigame.com
Taliwas sa naisapubliko na $ 6 milyong figure, ang semianalysis ay nagpapakita ng Deepseek ay nagpapatakbo ng isang napakalaking imprastraktura na humigit -kumulang 50,000 NVIDIA HOPPER GPU, na nagkakahalaga ng halos $ 1.6 bilyon, na may mga gastos sa pagpapatakbo na umaabot sa $ 944 milyon. Ang malaking pamumuhunan na ito, kasabay ng mataas na suweldo para sa mga mananaliksik nito (na lumampas sa $ 1.3 milyon taun -taon), ay umaakit ng nangungunang talento mula sa mga unibersidad sa Tsino. Ang kalikasan na pinondohan ng sarili ng kumpanya at naka-streamline na istraktura ay nag-aambag sa liksi at mabilis na pagbabago.
Imahe: ensigame.com
Habang ang pag-angkin ng "badyet-friendly" ng Deepseek ay nakaliligaw, ang pangkalahatang pamumuhunan nito ng higit sa $ 500 milyon sa pag-unlad ng AI, na sinamahan ng mga teknikal na pambihirang tagumpay at bihasang manggagawa, ay nagbibigay-daan upang makipagkumpetensya nang epektibo. Ang paghahambing ng mga gastos sa pagsasanay ay higit na nag -highlight nito: Ang R1's R1 ay nagkakahalaga ng $ 5 milyon, habang ang Chatgpt 4 ay naiulat na nagkakahalaga ng $ 100 milyon, na nagpapakita ng isang makabuluhang kalamangan sa gastos, kahit na isinasaalang -alang ang aktwal na pamumuhunan ng Deepseek.
Imahe: ensigame.com
Ang tagumpay ng Deepseek ay binibigyang diin ang potensyal ng mahusay na pondo, independiyenteng mga kumpanya ng AI upang hamunin ang mga itinatag na manlalaro. Gayunpaman, ang mga nakamit nito ay nakaugat sa malaking pamumuhunan, pagsulong sa teknolohiya, at isang mataas na bihasang koponan, na ginagawa ang paunang "murang" salaysay na isang labis na pag-iingat.