Согласно отчету SemiAnalysis, затраты на обучение DeepSeek V3 составляют более $6 млн

от admin 04.02.2025

04.02.2025

Исследовательская фирма SemiAnalysis провела обширный анализ того, что на самом деле стоит за DeepSeek с точки зрения затрат на обучение, опровергнув рассказ о том, что R1 стал настолько эффективным, что вычислительные ресурсы от NVIDIA и других не нужны.

Было заявлено, что DeepSeek использовала только «5 миллионов долларов» для своей модели R1, что на одном уровне с o1 от OpenAI GPT, и это вызвало розничную панику, которая отразилась на фондовом рынке США ; однако теперь, когда слух развеян, посмотреть стоит на фактические цифры.

Для тех, кто не в курсе, DeepSeek, как говорят, был побочным проектом китайского хедж-фонда High-Flyer, а в отчете SemiAnalysis утверждается, что они приобрели 10000 единиц NVIDIA A100 еще в 2021 году, когда экспортные ограничения не были такими агрессивными. Затем DeepSeek превратился в отдельную организацию, поскольку материнская компания High-Flyer решила отделить проект, и вот тогда все действительно пошло. С этого момента они начали накапливать вычислительные ресурсы.

Согласно отчету SemiAnalysis, затраты на обучение DeepSeek V3 составляют более $6 млн

В отчете говорится, что DeepSeek имеет около 10000 графических процессоров NVIDIA H800 AI, предназначенных для «китайского рынка», и 10000 более дорогих чипов H100 AI. Более того, компания инвестировала в ускорители NVIDIA H20 AI, и у них есть «пул» ресурсов, которые DeepSeek и High-Flyer совместно используют для «торговли, вывода, обучения и исследований». Это составляет около 1,6 млрд долларов США в капитальных вложениях для DeepSeek, а эксплуатационные расходы, по слухам, составляют около 944 млн долларов США. Эти цифры примерно в четыреста раз выше, чем изначально предполагали рынки.

Читать:

Охлаждение GPU хотят улучшить искусственными алмазами - это понизит температуру чипа на 10-20 градусов

Для ясности, первоначальная цифра, как говорят, является «определенной частью» расходов на обучение, вероятно, связанных с запуском окончательной модели. Единственное, в чем DeepSeek действительно преуспел, так это в извлечении выгоды из местных талантов с помощью мероприятий по набору в лучших местных университетах, с зарплатами более 1,3 миллиона долларов для конкретных сотрудников. Мозги, стоящие за моделью R1 DeepSeek, действительно были способны предложить эффективное решение, чтобы конкурировать с подобными OpenAI, но «неверно представленные» финансовые показатели послужили катализатором в событии черного лебедя на прошлой неделе.

Помимо этого, SemiAnalysis провела обширное тестирование модели искусственного интеллекта DeepSeek, если кто-то хочет с ней ознакомиться конкретнее, поскольку в ней упоминаются интересные детали.

Железо Технологии

Предыдущая запись

Следы невиданных зверей. Академик РАН — о загадочных отверстиях на дне Атлантики

Следующая запись

Согласно отчету SemiAnalysis, затраты на обучение DeepSeek V3 составляют более $6 млн

Следы невиданных зверей. Академик РАН — о загадочных отверстиях на дне Атлантики

В России провели капремонт 160 млн кв. м жилья в 2024 году

Похожие публикации