Удивительно доступная доступная модель ИИ Deepseek бросает вызов гигантам отрасли. Компания утверждает, что обучила свою мощную нейронную сеть Deepseek V3 всего за 6 миллионов долларов, используя только 2048 графических процессоров, что резко контрастирует с расходами конкурентов. Тем не менее, эта цифра отражает только предварительные затраты на GPU, пропуская существенные исследования, уточнения, обработку данных и расходы на инфраструктуру.
Изображение: Ensigame.com
Инновационная технология DeepSeek отличает его. Ключевые особенности включают многократный прогноз (MTP) для одновременного прогнозирования слов, смесь экспертов (MOE), используя 256 нейронных сетей для улучшения обработки, и многопользовательское скрытое внимание (MLA) для улучшения извлечения информации. Эти достижения способствуют точности и эффективности модели.
Изображение: Ensigame.com
Вопреки опубликованной цифре в размере 6 миллионов долларов, полуанализ показывает, что Deepseek управляет массовой инфраструктурой примерно 50 000 графических процессоров Nvidia Hopper, стоимостью примерно 1,6 миллиарда долларов, при этом эксплуатационные расходы достигают 944 миллиона долларов. Эти существенные инвестиции в сочетании с высокой заработной платой для исследователей (превышают 1,3 миллиона долларов в год), привлекает лучшие таланты из китайских университетов. Самофинансируемая природа и оптимизированная структура компании способствуют его ловкости и быстрым инновациям.
Изображение: Ensigame.com
В то время как заявление DeepSeek «Бюджетное» вводит в заблуждение, общие инвестиции в разработку ИИ составляют более 500 миллионов долларов США в сочетании с его техническими прорывами и квалифицированной рабочей силой, позволяют эффективно конкурировать. Сравнение затрат на обучение дополнительно подчеркивает это: Deepseek R1 стоит 5 миллионов долларов, в то время как CHATGPT 4, как сообщается, стоит 100 миллионов долларов, демонстрируя значительное преимущество затрат, даже учитывая фактические инвестиции DeepSeek.
Изображение: Ensigame.com
Успех DeepSeek подчеркивает потенциал хорошо финансируемых, независимых компаний искусственного интеллекта, чтобы бросить вызов устоявшимся игрокам. Тем не менее, его достижения основаны на существенных инвестициях, технологических достижениях и высококвалифицированной команде, что делает первоначальный «недорогой» повествование в упрощение.