DeepSeek V4-Pro: скидка 75% теперь навсегда

DeepSeek закрепила «скидочную» цену V4-Pro как постоянную. Лучшее соотношение цена-качество среди моделей с миллионным контекстом — что это значит и как применять.

ОбзорИнструментыИИ-агенты
🐋
DeepSeek сначала запустила V4-Pro со скидкой 75% и поставила дедлайн. Вчера объявили: цена остаётся такой навсегда. Получилось, что флагман с миллионом контекста теперь стоит дешевле большинства флагманских моделей прошлого поколения.

Так что конкретно произошло

Когда V4-Pro выходила, её поставили в 25% от плановой цены и назвали промо-акцией с дедлайном 31 мая. Большинство ждало, что после этой даты прайс умножится на четыре.

Не умножится. DeepSeek зафиксировала постоянный тариф: $0.435 за миллион входных токенов и $0.87 за миллион выходных. В рублях по текущему курсу это примерно 35 ₽ за миллион входных и 70 ₽ за миллион выходных. Кеш-хит на входе и вовсе $0.003625 — почти бесплатно. За модель уровня фронтира с честным окном в 1 000 000 токенов.

Чтобы было нагляднее: миллион выходных токенов — это больше тысячи страниц связного текста, целая толстая книга. И генерация такой книги топовой моделью стоит меньше доллара. Сопоставимые западные модели с похожим окном — от GPT-5.4 и Sonnet 4.6 до Opus 4.6 и GPT-5.5 — на выходе дороже в 10–30 раз.

Почему это не просто очередное «китайцы демпингуют»

Раньше разговор про дешёвые китайские модели звучал предсказуемо: да, дешевле, но качество на полступени позади, длинный контекст компромиссный, на проде ставить страшно. V4-Pro этот разговор закрывает.

По задачам рассуждения, кода и длинных документов модель идёт вровень с топами, местами обгоняет: на SWE-bench Verified — 80.6%, в полшага от Claude Opus 4.6. Миллион токенов у неё реально рабочий до нескольких сотен тысяч — можно загнать кодовую базу или книгу и получать осмысленные ответы. Дальше точность постепенно проседает: на 400–500K модель уже скорее пересказывает архитектуру, чем цитирует строчки дословно. Но даже с этой оговоркой при такой цене её можно гонять как рабочую лошадку под весь конвейер: парсинг, классификация, рассуждение, генерация.

Если коротко

Китайцы победят. Если не качеством, то ценой, а судя по V4-Pro — уже и тем, и другим одновременно. DeepSeek в этой истории молодцы: они переписывают экономику использования LLM в проде, а не играют в ценовые войны на месяц.

Где это реально пригодится

  • Анализ больших кодовых баз. Кладёте весь проект в контекст и просите найти баг, описать архитектуру или предложить рефакторинг. Один вызов вместо нарезки на куски.
  • Длинные документы и переписки. Контракт на 200 страниц, годовая почта с клиентом, стенограмма созвона. Без RAG, эмбеддингов и векторной базы.
  • Агенты с длинной памятью. Длинный контекст из роскоши становится нормой. Можно не изобретать схемы саммари и не терять детали между шагами.
  • Q&A по корпоративным данным. Wiki, регламенты, тикеты — задаёте вопросы напрямую, без отдельной поисковой инфраструктуры.
  • Массовая обработка. Классификация писем, разметка лидов, извлечение данных из тысяч PDF, перевод документации. То, что упиралось в бюджет, помещается в обычную месячную смету.

Как попробовать у себя

Зарегистрируйтесь в platform.deepseek.com и возьмите API-ключ. Эндпоинт совместим с OpenAI-форматом: в большинстве библиотек хватит поменять base_url и api_key, код трогать не нужно. Перенесите на V4-Pro один не критичный пайплайн (классификацию или саммари), сравните по качеству и цене со своей текущей моделью на неделе реальных данных. Не устроило — вы потеряли пару долларов на тестах.

💡
Практический шаг на эту неделю: возьмите свой ИИ-сценарий, который вы откладывали из-за стоимости, и пересчитайте его экономику на V4-Pro. С большой вероятностью он уже окупается.

По теме

Тема цены, длинного контекста и того, как это меняет повседневную работу с моделями, пересекается с консультациями по архитектуре ИИ-агентов и оптимизации стоимости инференса.

Если захотите обсудить, как это применить у себя или в команде — пишите в Telegram @pimenov