Deepseek yang menghairankan model AI yang berpatutan mencabar gergasi industri. Syarikat itu mendakwa telah melatih rangkaian saraf Deepseek V3 yang kuat untuk hanya $ 6 juta, hanya menggunakan 2048 GPU, yang berbeza dengan perbelanjaan pesaing. Walau bagaimanapun, angka ini hanya mencerminkan kos GPU pra-latihan, menghilangkan penyelidikan, penghalusan, pemprosesan data, dan perbelanjaan infrastruktur yang besar.
imej: ensigame.com
Teknologi inovatif Deepseek membezakannya. Ciri-ciri utama termasuk Ramalan Multi-Token (MTP) untuk ramalan perkataan serentak, campuran pakar (MOE) yang memanfaatkan 256 rangkaian saraf untuk pemprosesan yang dipertingkatkan, dan perhatian laten multi-kepala (MLA) untuk pengekstrakan maklumat yang lebih baik. Kemajuan ini menyumbang kepada ketepatan dan kecekapan model.
imej: ensigame.com
Bertentangan dengan angka $ 6 juta yang dipublikasikan, semianalisis mendedahkan DeepSeek mengendalikan infrastruktur besar -besaran kira -kira 50,000 GPU Nvidia Hopper, bernilai kira -kira $ 1.6 bilion, dengan kos operasi mencecah $ 944 juta. Pelaburan besar ini, ditambah dengan gaji yang tinggi untuk penyelidiknya (melebihi $ 1.3 juta setahun), menarik bakat teratas dari universiti -universiti China. Sifat yang dibiayai sendiri oleh syarikat dan struktur yang diselaraskan menyumbang kepada ketangkasan dan inovasi pesatnya.
imej: ensigame.com
Walaupun tuntutan "mesra bajet" Deepseek adalah mengelirukan, pelaburan keseluruhannya lebih daripada $ 500 juta dalam pembangunan AI, digabungkan dengan penemuan teknikalnya dan tenaga kerja mahir, membolehkannya bersaing dengan berkesan. Perbandingan kos latihan seterusnya menyoroti ini: DeepSeek's R1 berharga $ 5 juta, sementara Chatgpt 4 dilaporkan berharga $ 100 juta, menunjukkan kelebihan kos yang signifikan, walaupun mengingati pelaburan sebenar Deepseek.
imej: ensigame.com
Kejayaan DeepSeek menggariskan potensi syarikat AI yang dibiayai dengan baik untuk mencabar pemain yang ditubuhkan. Walau bagaimanapun, pencapaiannya berakar umbi dalam pelaburan yang besar, kemajuan teknologi, dan pasukan yang sangat mahir, menjadikan naratif awal "kos rendah" awal.