Исследовательская фирма SemiAnalysis провела обширный анализ того, что на самом деле стоит за DeepSeek с точки зрения затрат на обучение, опровергнув рассказ о том, что R1 стал настолько эффективным, что вычислительные ресурсы от NVIDIA и других не нужны.
Было заявлено, что DeepSeek использовала только «5 миллионов долларов» для своей модели R1, что на одном уровне с o1 от OpenAI GPT, и это вызвало розничную панику, которая отразилась на фондовом рынке США ; однако теперь, когда слух развеян, посмотреть стоит на фактические цифры.
Для тех, кто не в курсе, DeepSeek, как говорят, был побочным проектом китайского хедж-фонда High-Flyer, а в отчете SemiAnalysis утверждается, что они приобрели 10000 единиц NVIDIA A100 еще в 2021 году, когда экспортные ограничения не были такими агрессивными. Затем DeepSeek превратился в отдельную организацию, поскольку материнская компания High-Flyer решила отделить проект, и вот тогда все действительно пошло. С этого момента они начали накапливать вычислительные ресурсы.
В отчете говорится, что DeepSeek имеет около 10000 графических процессоров NVIDIA H800 AI, предназначенных для «китайского рынка», и 10000 более дорогих чипов H100 AI. Более того, компания инвестировала в ускорители NVIDIA H20 AI, и у них есть «пул» ресурсов, которые DeepSeek и High-Flyer совместно используют для «торговли, вывода, обучения и исследований». Это составляет около 1,6 млрд долларов США в капитальных вложениях для DeepSeek, а эксплуатационные расходы, по слухам, составляют около 944 млн долларов США. Эти цифры примерно в четыреста раз выше, чем изначально предполагали рынки.
Для ясности, первоначальная цифра, как говорят, является «определенной частью» расходов на обучение, вероятно, связанных с запуском окончательной модели. Единственное, в чем DeepSeek действительно преуспел, так это в извлечении выгоды из местных талантов с помощью мероприятий по набору в лучших местных университетах, с зарплатами более 1,3 миллиона долларов для конкретных сотрудников. Мозги, стоящие за моделью R1 DeepSeek, действительно были способны предложить эффективное решение, чтобы конкурировать с подобными OpenAI, но «неверно представленные» финансовые показатели послужили катализатором в событии черного лебедя на прошлой неделе.
Помимо этого, SemiAnalysis провела обширное тестирование модели искусственного интеллекта DeepSeek, если кто-то хочет с ней ознакомиться конкретнее, поскольку в ней упоминаются интересные детали.