Zaskakująco przystępne ceny AI Deepseek rzuca wyzwanie gigantom branżowym. Firma twierdzi, że przeszkoliła swoją potężną sieć neuronową Deepseek V3 za zaledwie 6 milionów dolarów, wykorzystując tylko 2048 GPU, co stanowi wyraźny kontrast z wydatkami konkurencji. Jednak liczba ta odzwierciedla jedynie koszty GPU przed treningiem, pomijając znaczne badania, udoskonalenie, przetwarzanie danych i wydatki na infrastrukturę.
Obraz: engame.com
Innowacyjna technologia Deepseek go wyróżnia. Kluczowe cechy obejmują prognozę wielofunkcyjną (MTP) do jednoczesnej prognozy słów, mieszanki ekspertów (MOE) wykorzystujących 256 sieci neuronowych do lepszego przetwarzania oraz wielopłasowolą ukrytą uwagę (MLA) w celu poprawy ekstrakcji informacji. Postępy te przyczyniają się do dokładności i wydajności modelu.
Obraz: engame.com
W przeciwieństwie do nagłośnionej liczby 6 milionów dolarów, SEMIANALIZA ujawnia, że Deepseek prowadzi ogromną infrastrukturę w wysokości około 50 000 GPU Nvidia Hopper, o wartości około 1,6 miliarda dolarów, a koszty operacyjne wynoszą 944 miliony dolarów. Ta znaczna inwestycja, w połączeniu z wysokimi wynagrodzeniami dla swoich badaczy (przekraczających 1,3 miliona dolarów rocznie), przyciąga najwyższe talenty chińskich uniwersytetów. Samofinansowany charakter i usprawniona struktura firmy przyczyniają się do jej zwinności i szybkiej innowacji.
Obraz: engame.com
Podczas gdy „przyjazne dla budżetu” roszczenie Deepseek wprowadza w błąd, ogólna inwestycja w wysokości ponad 500 milionów dolarów w rozwój AI, w połączeniu z przełom technicznym i wykwalifikowaną siłą roboczą, pozwala jej skutecznie konkurować. Porównanie kosztów szkolenia dodatkowo podkreśla to: R1 Deepseek kosztował 5 milionów dolarów, podczas gdy Chatgpt 4 podobno kosztował 100 milionów dolarów, wykazując znaczną przewagę kosztową, nawet biorąc pod uwagę faktyczną inwestycję Deepseek.
Obraz: engame.com
Sukces Deepseek podkreśla potencjał dobrze finansowanych, niezależnych firm AI do rzucenia wyzwania uznanym graczom. Jednak jego osiągnięcia są zakorzenione w znacznych inwestycjach, postępach technologicznych i wysoko wykwalifikowanym zespole, dzięki czemu początkowa „tanie” narracja stanowi nadmierne uproszczenie.