AI โมเดล AI ที่มีราคาไม่แพงอย่างน่าประหลาดใจของ Deepseek ท้าทายยักษ์ใหญ่ในอุตสาหกรรม บริษัท อ้างว่าได้ฝึกอบรมเครือข่ายประสาท Deepseek V3 ที่ทรงพลังในราคาเพียง 6 ล้านเหรียญสหรัฐโดยใช้ GPU เพียง 2048 ซึ่งตรงกันข้ามกับค่าใช้จ่ายของคู่แข่ง อย่างไรก็ตามตัวเลขนี้สะท้อนให้เห็นถึงค่าใช้จ่าย GPU ก่อนการฝึกอบรมก่อนการวิจัยที่สำคัญการปรับแต่งการประมวลผลข้อมูลและค่าใช้จ่ายโครงสร้างพื้นฐาน
IMGP%Image: Ensigame.com
เทคโนโลยีที่เป็นนวัตกรรมของ Deepseek แยกแยะความแตกต่าง คุณสมบัติที่สำคัญ ได้แก่ การทำนายแบบหลาย Token (MTP) สำหรับการทำนายคำพร้อมกันการผสมผสานของผู้เชี่ยวชาญ (MOE) ใช้ประโยชน์จาก 256 เครือข่ายประสาทสำหรับการประมวลผลที่เพิ่มขึ้นและความสนใจแฝงหลายหัว (MLA) สำหรับการสกัดข้อมูลที่ดีขึ้น ความก้าวหน้าเหล่านี้นำไปสู่ความแม่นยำและประสิทธิภาพของโมเดล
IMGP%Image: Ensigame.com
ตรงกันข้ามกับตัวเลขที่เผยแพร่ 6 ล้านเหรียญ Semianalysis เผยให้เห็น Deepseek ดำเนินการโครงสร้างพื้นฐานขนาดใหญ่ประมาณ 50,000 Nvidia Hopper GPUs มูลค่าประมาณ 1.6 พันล้านดอลลาร์โดยมีค่าใช้จ่ายในการดำเนินงานสูงถึง 944 ล้านดอลลาร์ การลงทุนที่สำคัญนี้ประกอบกับเงินเดือนสูงสำหรับนักวิจัย (เกิน $ 1.3 ล้านต่อปี) ดึงดูดความสามารถสูงสุดจากมหาวิทยาลัยจีน ธรรมชาติที่ได้รับการสนับสนุนตนเองของ บริษัท และโครงสร้างที่มีความคล่องตัวมีส่วนช่วยให้เกิดความคล่องตัวและนวัตกรรมอย่างรวดเร็ว
IMGP%Image: Ensigame.com
ในขณะที่การเรียกร้อง "เป็นมิตรกับงบประมาณ" ของ Deepseek นั้นทำให้เข้าใจผิด แต่การลงทุนโดยรวมมากกว่า $ 500 ล้านในการพัฒนา AI รวมกับความก้าวหน้าทางเทคนิคและพนักงานที่มีทักษะช่วยให้สามารถแข่งขันได้อย่างมีประสิทธิภาพ การเปรียบเทียบค่าใช้จ่ายในการฝึกอบรมเน้นสิ่งนี้เพิ่มเติม: R1 ของ Deepseek มีราคา $ 5 ล้านในขณะที่ Chatgpt 4 มีค่าใช้จ่าย $ 100 ล้านแสดงให้เห็นถึงความได้เปรียบด้านต้นทุนที่สำคัญแม้จะพิจารณาการลงทุนจริงของ Deepseek
IMGP%Image: Ensigame.com
ความสำเร็จของ Deepseek ได้เน้นย้ำถึงศักยภาพของ บริษัท AI ที่ได้รับการสนับสนุนและได้รับการสนับสนุนอย่างดีเพื่อท้าทายผู้เล่นที่จัดตั้งขึ้น อย่างไรก็ตามความสำเร็จของมันมีรากฐานมาจากการลงทุนที่สำคัญความก้าวหน้าทางเทคโนโลยีและทีมที่มีทักษะสูงทำให้การเล่าเรื่อง "ต้นทุนต่ำ" เริ่มต้นเป็นการเริ่มต้น