DeepSeek обучила «рассуждающую» модель R1 за 294 000 USD

DeepSeek раскрыла информацию о затратах на обучение генеративной модели R1, которая была представлена в начале текущего года. Китайская компания использовал для этого 512 чипов H800 производства Nvidia. Обучение модели обошлось ей в 294 000 USD. Данные об этом опубликовал академический журнал Nature.

 

Потраченная китайской компанией сумма намного скромнее расходов конкурентов из США. В 2023 году глава OpenAI С. Альтман заявил, что компания израсходовала на бучение генеративных моделей более 100 млн USD.

 

Американские эксперты усомнились в достоверности озвученной DeepSeek информации о расходах. Они считают, что компания из Поднебесной существенно их занизила. По их словам, китайцы принимают в расчет лишь издержки на последнем этапе обучения. Таким образом, его полная стоимость может быть гораздо выше.

 

В августе журналисты FT сообщили, что DeepSeek пришлось отложить премьеру ИИ-модели R2. Виной всему чипы Ascend производства Huawei. Компания испытывает с ними «постоянные технические проблемы». Это привело к переносу сроков вывода новой ИИ-