Mô hình AI giá cả phải chăng đáng ngạc nhiên của Deepseek thách thức những người khổng lồ trong ngành. Công ty tuyên bố đã đào tạo mạng lưới thần kinh Deepseek V3 mạnh mẽ của mình chỉ với 6 triệu đô la, chỉ sử dụng GPU 2048, một sự tương phản rõ rệt với chi tiêu của các đối thủ cạnh tranh. Tuy nhiên, con số này chỉ phản ánh chi phí GPU trước khi đào tạo, bỏ qua nghiên cứu đáng kể, sàng lọc, xử lý dữ liệu và chi phí cơ sở hạ tầng.
Hình ảnh: Obligame.com
Công nghệ sáng tạo của Deepseek phân biệt nó. Các tính năng chính bao gồm Dự đoán đa điểm (MTP) để dự đoán từ đồng thời, hỗn hợp các chuyên gia (MOE) tận dụng 256 mạng thần kinh để xử lý nâng cao và chú ý nhiều đầu (MLA) để chiết xuất thông tin được cải thiện. Những tiến bộ này góp phần vào độ chính xác và hiệu quả của mô hình.
Hình ảnh: Obligame.com
Trái ngược với con số 6 triệu đô la được công bố hóa, Semianalysis cho thấy Deepseek vận hành một cơ sở hạ tầng khổng lồ khoảng 50.000 GPU phễu NVIDIA, trị giá khoảng 1,6 tỷ đô la, với chi phí hoạt động lên tới 944 triệu đô la. Khoản đầu tư đáng kể này, cùng với mức lương cao cho các nhà nghiên cứu (vượt quá 1,3 triệu đô la hàng năm), thu hút tài năng hàng đầu từ các trường đại học Trung Quốc. Bản chất tự tài trợ của công ty và cấu trúc hợp lý góp phần vào sự nhanh nhẹn và đổi mới nhanh chóng.
Hình ảnh: Obligame.com
Trong khi tuyên bố "thân thiện với ngân sách" của Deepseek là sai lệch, khoản đầu tư chung hơn 500 triệu đô la vào phát triển AI, kết hợp với các đột phá kỹ thuật và lực lượng lao động lành nghề, cho phép nó cạnh tranh hiệu quả. Một so sánh về chi phí đào tạo làm nổi bật thêm điều này: R1 của Deepseek có giá 5 triệu đô la, trong khi TATGPT 4 báo cáo có giá 100 triệu đô la, cho thấy một lợi thế chi phí đáng kể, thậm chí xem xét đầu tư thực tế của Deepseek.
Hình ảnh: Obligame.com
Thành công của Deepseek nhấn mạnh tiềm năng của các công ty AI độc lập, được tài trợ tốt để thách thức những người chơi thành lập. Tuy nhiên, thành tích của nó bắt nguồn từ đầu tư đáng kể, tiến bộ công nghệ và một nhóm có tay nghề cao, làm cho câu chuyện "chi phí thấp" ban đầu trở thành sự đơn giản hóa.