Deepseek'in şaşırtıcı derecede uygun AI modeli endüstri devlerine meydan okuyor. Şirket, güçlü Deepseek V3 sinir ağını sadece 6 milyon dolar için eğittiğini iddia ediyor ve sadece 2048 GPU kullanıyor. Bununla birlikte, bu rakam yalnızca GPU öncesi maliyetleri, önemli araştırmaları, arıtma, veri işleme ve altyapı giderlerini yansıtır.
%İmgp%resim: ensigame.com
Deepseek'in yenilikçi teknolojisi onu ayırt ediyor. Temel özellikler arasında eşzamanlı kelime tahmini için çoklu eğimli tahmin (MTP), gelişmiş işlem için 256 sinir ağından yararlanan uzmanların (MOE) karışımı ve geliştirilmiş bilgi çıkarma için çok başlı gizli dikkat (MLA) bulunmaktadır. Bu gelişmeler modelin doğruluğuna ve verimliliğine katkıda bulunur.
%İmgp%resim: ensigame.com
Yayınlanan 6 milyon dolarlık rakamın aksine Semianalysis, Deepseek'in yaklaşık 1.6 milyar dolar değerinde yaklaşık 50.000 NVIDIA Hopper GPU'luk büyük bir altyapı işlettiğini ve operasyonel maliyetlerin 944 milyon dolara ulaştığını ortaya koyuyor. Bu önemli yatırım, araştırmacılar için yüksek maaşlarla birleştiğinde (yılda 1,3 milyon doları aşan), Çin üniversitelerinden en iyi yetenekleri çekiyor. Şirketin kendi kendini finanse edilen doğası ve aerodinamik yapısı çevikliğine ve hızlı inovasyonuna katkıda bulunur.
%İmgp%resim: ensigame.com
Deepseek'in "bütçe dostu" iddiası yanıltıcı olsa da, AI gelişimine 500 milyon doların üzerinde olan toplam yatırımı, teknik atılımları ve yetenekli işgücü ile birleştiğinde etkili bir şekilde rekabet etmesine izin veriyor. Eğitim maliyetlerinin karşılaştırılması bunu daha da vurgulamaktadır: Deepseek'in R1'in maliyeti 5 milyon dolara mal olurken, ChatGPT 4'ün 100 milyon dolara mal olduğu ve Deepseek'in gerçek yatırımı göz önüne alındığında bile önemli bir maliyet avantajı gösterdiği bildiriliyor.
%İmgp%resim: ensigame.com
Deepseek'in başarısı, iyi finanse edilen, bağımsız AI şirketlerinin yerleşik oyunculara meydan okuma potansiyelinin altını çiziyor. Bununla birlikte, başarıları önemli yatırımlar, teknolojik gelişmeler ve yüksek vasıflı bir ekipten kaynaklanmaktadır, bu da ilk "düşük maliyetli" anlatıyı aşırı basitleştirme haline getirir.