DeepSeek의 놀랍게도 저렴한 AI 모델은 업계 거인에게 도전합니다. 이 회사는 경쟁 업체의 지출과는 대조적으로 2048 GPU 만 사용하여 강력한 Deepseek V3 Neural Network를 6 백만 달러에 불과했다고 주장했다. 그러나이 수치는 사전 훈련 GPU 비용, 실질적인 연구, 개선, 데이터 처리 및 인프라 비용을 생략하는 것만 반영합니다.
이미지 : ensigame.com
Deepseek의 혁신적인 기술은이를 구별합니다. 주요 기능으로는 동시 단어 예측을위한 다중 점화 예측 (MTP), 강화 된 처리를 위해 256 개의 신경망을 활용하는 전문가 (MOE) 및 정보 추출 개선을위한 다중 헤드 잠재주의 (MLA)가 포함됩니다. 이러한 발전은 모델의 정확성과 효율성에 기여합니다.
이미지 : ensigame.com
Semianalysis는 공개 된 6 백만 달러의 수치와는 달리 DeepSeek은 약 50,000 달러의 NVIDIA HOPPER GPU의 대규모 인프라를 운영하는 비용이 약 16 억 달러이며 운영 비용은 9 억 9,400 만 달러에 이릅니다. 이 상당한 투자는 연구원들을위한 높은 급여 (연간 130 만 달러를 초과)와 함께 중국 대학에서 최고의 인재를 유치합니다. 회사의 자체 자금 지원 성격과 간소화 된 구조는 민첩성과 빠른 혁신에 기여합니다.
이미지 : ensigame.com
DeepSeek의 "예산 친화적 인"주장은 오해의 소지가 있지만 기술 혁신 및 숙련 된 인력과 결합 된 AI 개발에 5 억 달러가 넘는 전반적인 투자를 통해 효과적으로 경쟁 할 수 있습니다. 교육 비용의 비교는 다음과 같이 강조합니다. DeepSeek의 R1은 5 백만 달러이며 Chatgpt 4는 1 억 달러가 소요되었으며 DeepSeek의 실제 투자를 고려하더라도 상당한 비용 이점을 보여줍니다.
이미지 : ensigame.com
DeepSeek의 성공은 잘 자금을 지원 받고 독립적 인 AI 회사의 잠재력을 강조하여 기존 플레이어에게 도전 할 수 있습니다. 그러나 그 성과는 상당한 투자, 기술 발전 및 고도로 숙련 된 팀에 뿌리를두고있어 초기 "저비용"이야기를 지나치게 단순화합니다.