GigaChat MAX vs YandexGPT 5 Pro vs DeepSeek: что выбрать бизнесу под 152-ФЗ в 2026
Сравниваем три актуальные LLM для российского бизнеса в мае 2026: цены, контекст, fine-tuning, юридические аспекты под 152-ФЗ и проект ФЗ о доверенных моделях ИИ. С таблицей, типовыми сценариями и расчётом стоимости на реальных нагрузках.
GigaChat MAX vs YandexGPT 5 Pro vs DeepSeek: что выбрать бизнесу под 152-ФЗ в 2026
Каждый второй разговор о внедрении AI-ассистента в 2026 году начинается с одного и того же вопроса: «А подключаться к ChatGPT, к GigaChat или к YandexGPT?» — и где-то к середине обсуждения добавляется «а что там по DeepSeek, говорят дёшево». Простого ответа на этот вопрос нет — он зависит от объёма запросов, чувствительности данных, требований к локализации и того, что вы вообще собираетесь делать. Ниже — разбор по трём моделям, которые реально имеет смысл рассматривать в РФ-сегменте в мае 2026, с акцентом на 152-ФЗ и проект федерального закона о регулировании ИИ.
TL;DR
Если работаете с персональными данными граждан РФ или обслуживаете госконтракты — берите GigaChat MAX или YandexGPT 5 Pro: данные обрабатываются в РФ, обе модели формально подходят под определение «доверенной» в проекте ФЗ Минцифры (опубликован в марте 2026, обсуждение до июня). Для чистой коммерции без ПДн и с упором на цену/контекст/reasoning — DeepSeek V4-Pro/Flash в десять раз дешевле российских аналогов и не уступает им по качеству на русском, но передача данных в Китай требует отдельной юридической проработки и (для ПДн) — уведомления РКН о трансграничной передаче.
Главное
На рынке появилась категория «доверенных моделей» — пока в виде проекта ФЗ. Госкорпорации и крупный бизнес с 2026–2027 обязаны мигрировать на модели, прошедшие сертификацию. GigaChat и YandexGPT в эту категорию явно входят, DeepSeek и OpenAI — нет.
YandexGPT 5 Pro: контекст 128k токенов, reasoning-режим, fine-tuning, асинхронные батчи, цена ~50 ₽ за 1 млн токенов входа на тарифе Pro. Хорошо знает русский деловой язык, плохо — нишевые домены.
GigaChat 3 Ultra (релиз марта 2026): сопоставим с YandexGPT по качеству на русском, отдельно есть платформа ГигаЧат Бизнес для построения «цифровых сотрудников» с RAG и интеграцией в CRM/1C.
DeepSeek V4-Pro (1M токенов контекста, MoE-архитектура): на 1–2 порядка дешевле российских моделей, лучший reasoning на длинных текстах, но серверы в КНР — для ПДн без отдельных юридических оснований не подходит.
Все три можно собрать в одну архитектуру: GigaChat/YandexGPT для задач с ПДн, DeepSeek для обработки публичных документов и тяжёлой аналитики. Так делают серьёзные команды в 2026.
Что поменялось в 2025–2026
Два события задают ландшафт.
Первое — проект ФЗ о регулировании ИИ. В марте 2026 Минцифры опубликовало для общественного обсуждения проект федерального закона «Об основах регулирования отношений в сфере искусственного интеллекта». Ключевая для бизнеса часть — введение понятия «доверенная модель ИИ»: модель, разработанная или адаптированная отечественным разработчиком, проходящая аудит и сертификацию, с обработкой данных на инфраструктуре в РФ. Госкорпорациям и критической инфраструктуре с 2027 года обязательно использовать только такие модели.
«Государство требует от крупного бизнеса и госкорпораций переходить на доверенные модели. Это означает гарантированный спрос для таких игроков, как Сбер с GigaChat, Яндекс с YandexGPT и других участников альянса в сфере ИИ.» — обзор «Российские нейросети 2026», VC.ru, март 2026.
На остальной бизнес распространяются мягкие рекомендации, но обработка ПДн «недоверенными» моделями в существующей логике 152-ФЗ автоматически превращается в трансграничную передачу со всеми вытекающими.
Второе — выросли тарифы и качество российских моделей. В 2024 году YandexGPT 2 был «попробовать», а GigaChat — заметно слабее GPT-3.5. В мае 2026 у обоих в линейке есть флагманы (YandexGPT 5 Pro, GigaChat 3 Ultra), сопоставимые с GPT-4-class моделями на бытовых задачах на русском языке. Плюс — обе модели соответствуют требованиям 152-ФЗ из коробки: данные не покидают РФ, операторы (АО «Яндекс», АО «Сбербанк») состоят в реестре, есть готовые юридические комплекты для интеграции.
В этом контексте выбор модели — это не только техника, но и юридика.
YandexGPT 5 Pro
Что это. Линейка LLM Яндекса, доступная через Yandex Cloud Foundation Models API. В мае 2026 актуальны три модели:
YandexGPT 5 Lite — быстрая дешёвая, подходит для классификации, простых ответов чат-бота, генерации коротких текстов. Контекст 32k.
YandexGPT 5 Pro — рабочая лошадка большинства бизнес-сценариев. Контекст 128k. Хорошее качество reasoning, форматирования и инструкций.
YandexGPT 5 Pro (reasoning mode) — режим с пошаговым рассуждением, удлиняет ответ в 2–3 раза, повышает качество на сложных задачах (анализ договоров, проверка фактов, многошаговые расчёты).
Цена в мае 2026 (ориентировочно). Lite: 0,2 ₽ за 1k входных токенов, 0,4 ₽ за 1k выходных. Pro: 0,8 ₽ / 1,6 ₽. Reasoning — отдельный тариф, дороже на 30–50%. Есть тариф Foundation для крупных клиентов с фиксированной ценой за месяц и квотой.
Что хорошо:
Все данные хранятся и обрабатываются в РФ-инфраструктуре Yandex Cloud. По 152-ФЗ — никаких трансграничных вопросов.
Поддерживается fine-tuning через консоль (LoRA-подход, недорогой, занимает 1–4 часа на типовом датасете).
Хорошо знает русский деловой язык, ГОСТовое оформление, типовые тексты для отчётов и писем.
Асинхронный batch-режим со скидкой 50% для офлайн-задач (массовая разметка, обработка архива документов).
Есть встроенная интеграция со Speech Kit, Translate, Vision OCR — это упрощает сборку пайплайна обработки документов.
Что плохо:
На нишевых доменах (юридические нюансы, специализированная медицина, узкая инженерная тематика) уступает GPT-4 и Claude-Sonnet. Нужен RAG или fine-tuning.
Контекст 128k достаточный, но не рекордный для рынка — DeepSeek и обновлённый Claude дают 1M.
API более чем стабильный, но иногда возникают «тихие» изменения поведения моделей при обновлениях. Стоит закладывать regression-тесты для критичных промптов.
GigaChat 3 Ultra и ГигаЧат Бизнес
Что это. Семейство LLM от Сбера. На май 2026 в линейке:
GigaChat Lite — аналог YandexGPT Lite, быстрые простые задачи.
GigaChat 2 / MAX — массовый сегмент, рабочая модель для большинства задач.
GigaChat 3 Ultra — флагман, релиз марта 2026. Контекст 128k, заявлено сопоставимое с GPT-4 качество на русском, поддержка инструкций сложного формата (JSON-strict, schema-guided generation).
В марте 2026 Сбер запустил отдельную платформу ГигаЧат Бизнес — это не просто LLM-API, а конструктор «цифровых сотрудников»: RAG-движок поверх собственных документов клиента, интеграция с CRM (включая «Битрикс24», AmoCRM), готовые модули для интеграции с 1C, no-code-сценарии диалогов.
Цена в мае 2026 (ориентировочно). В персональной версии — бесплатно с лимитом. Бизнес-API: pay-as-you-go аналогично YandexGPT, плюс корпоративные тарифы с фиксированной квотой. ГигаЧат Бизнес — отдельные тарифы на цифрового сотрудника, исчисляемые от 30 000 ₽/мес.
Что хорошо:
Полностью российская инфраструктура, входит в реестр отечественного ПО.
Сбер активно работает с госконтрактами — для компаний, претендующих на тендеры, наличие интеграции с GigaChat — формальный плюс.
ГигаЧат Бизнес сильно сокращает порог входа: можно собрать корпоративный ассистент за неделю силами одного аналитика без программирования.
Хорошая интеграция с другими сервисами Сбера (Сбер ID, оплата, банковские API).
Что плохо:
Тарифы и SLA менее прозрачны, чем у Yandex Cloud. Цены в публичной документации часто отличаются от того, что вам пришлют в коммерческом предложении.
Fine-tuning доступен, но только корпоративным клиентам по отдельному договору. Самообслуживания, как у Яндекса, нет.
Скорость отдельных запросов чуть ниже, чем у YandexGPT, особенно в моменты пиковой нагрузки.
Документация на API менее зрелая, чем у Яндекса, особенно по edge cases.
DeepSeek V4-Pro и V4-Flash
Что это. Линейка LLM китайской компании DeepSeek, доступная по публичному API. На май 2026:
DeepSeek V4-Flash — быстрый и дешёвый, контекст 1M токенов. Подходит для большинства бизнес-задач, по качеству сопоставим с GPT-4 class.
DeepSeek V4-Pro — флагман с глубоким reasoning-режимом, показывает ход рассуждений, контекст 1M. Для сложных задач анализа, разбора длинных документов, проверки логики.
В мае 2026 продолжается скидка 75% на ввод DeepSeek-моделей (до 31 мая 2026) — что делает их экономически вне конкуренции для задач, не связанных с ПДн.
Цена в мае 2026 (ориентировочно). Flash: ~3 ¢ за 1M токенов входа, ~12 ¢ за 1M выходных. Pro: ~14 ¢ / ~55 ¢. Это в 10–30 раз дешевле YandexGPT Pro и GigaChat MAX на эквивалентных объёмах.
Что хорошо:
Лучшее в индустрии соотношение «цена за токен / качество ответа» на май 2026.
Длинный контекст 1M — позволяет за один запрос обрабатывать сотни страниц договоров или регламентов без RAG.
Открытые веса базовой модели — можно развернуть DeepSeek-V3 или Llama-аналог локально (см. наш разбор on-prem LLM).
Очень сильный reasoning, особенно в Pro-режиме — на задачах с многошаговой логикой обходит YandexGPT и GigaChat.
Что плохо:
API DeepSeek хостится в КНР. Любая передача персональных данных через этот API формально подпадает под трансграничную передачу по ст. 12 152-ФЗ. Без отдельного согласия субъекта и уведомления РКН — нарушение.
Юридическая судебная практика по «китайским LLM и 152-ФЗ» в РФ пока тонкая. РКН в публичных позициях 2025–2026 не выделял DeepSeek в особую категорию, но и официальной поддержки «доверенной модели» там нет.
Для госконтрактов и регулируемых индустрий (банкинг, страхование, медицина) — однозначно мимо. Только Yandex или GigaChat.
Поддержка русского языка хорошая, но не такая же отполированная, как у российских моделей: бывают мелкие шероховатости в стилистике, переводе терминов.
Сравнительная таблица
Параметр
YandexGPT 5 Pro
GigaChat 3 Ultra
DeepSeek V4-Pro
Контекст
128k
128k
1M
Цена входа (1M токенов)
~800 ₽
~700 ₽
~14 ₽ (со скидкой до 31.05)
Reasoning-режим
да
да
да
Fine-tuning
self-service
по договору
open weights (only V3)
Хостинг данных
РФ
РФ
КНР
Подходит для ПДн
да
да
требует уведомления РКН по ст. 12
«Доверенная модель» по проекту ФЗ
да
да
нет
Подходит для госконтрактов
да
да
нет
Качество на русском
очень высокое
очень высокое
высокое
API-зрелость
высокая
средняя
высокая
Готовый no-code-конструктор
нет
есть (ГигаЧат Бизнес)
нет
Когда что выбирать: 4 типовых сценария
Сценарий 1. AI-ассистент клиентской поддержки на сайте малого бизнеса. Пользователь оставляет имя, email, телефон — это ПДн. Берите GigaChat 2 / MAX через ГигаЧат Бизнес-платформу: быстрый старт, RAG на ваших регламентах, интеграция с CRM. Альтернатива — YandexGPT 5 Lite с самостоятельной обвязкой RAG на pgvector.
Сценарий 2. Внутренний AI-аналитик для разбора длинных документов (договоры, отчёты, базы знаний). Если работает только с внутренними документами компании без ПДн клиентов — DeepSeek V4-Pro на 1M контекста за десятую часть бюджета. Если в документах могут попадаться ПДн (договоры с физлицами, переписка с клиентами) — берите YandexGPT 5 Pro в reasoning-режиме плюс RAG.
Сценарий 3. Цифровой сотрудник для исходящих коммуникаций (письма в ФНС, претензии контрагентам, ответы регуляторам). Тут нужен максимально «русский деловой стиль» и точность по терминологии. YandexGPT 5 Pro или GigaChat 3 Ultra, с разработанным промпт-пакетом и базой шаблонов в RAG. Это сценарий, который мы решаем в собственном продукте DocAssist (попробовать в кабинете — apps.xencom.ru) — там виден предел того, что вообще достижимо на сегодняшних российских моделях. Подробнее о разнице между AI-ассистентом и полноценным AI-агентом мы разобрали в отдельной статье.
Сценарий 4. Тяжёлый PoC с массовой обработкой документов (миллионы записей, эксперимент). Когда нужно за выходные перемолоть 10 ТБ публичной нормативки или обкатать гипотезу классификации — DeepSeek V4-Flash в batch-режиме. После того как гипотеза подтвердилась, перекладывайте production-пайплайн на российскую модель.
152-ФЗ: на что обратить внимание для каждой модели
При работе с YandexGPT и GigaChat:
Заключите договор поручения по ч. 3 ст. 6 152-ФЗ с оператором (АО «Яндекс» или ПАО «Сбербанк» — у обоих есть типовые формы).
Добавьте этого обработчика в уведомление в РКН (мы подробно разбирали, как правильно).
В политике конфиденциальности на сайте перечислите цели передачи ПДн в LLM-сервис («автоматическая обработка обращений пользователей», «генерация ответов на запросы»).
Получите явное согласие пользователя на эту цель — отдельным чекбоксом, не в общем согласии (см. 9 ошибок в согласиях).
Свяжите выбор модели с новыми требованиями 2026 года: оборотные штрафы, обязательная УПД и ЭТТН — полный чек-лист.
При работе с DeepSeek (или любым LLM с зарубежным хостингом):
Это трансграничная передача по ст. 12 152-ФЗ. КНР не входит в список стран с адекватным уровнем защиты ПДн, утверждённый РКН.
Нужно отдельное уведомление в РКН о намерении трансграничной передачи (ч. 4 ст. 12). Подаётся через личный кабинет на pd.rkn.gov.ru, проверяется до 10 рабочих дней.
Согласие субъекта должно явно упоминать страну передачи: «КНР, компания DeepSeek (Hangzhou) Ltd. с целью автоматической обработки запроса».
Для регулируемых отраслей (банкинг, страхование, медицина, госсектор) — фактически нерабочий вариант. РКН и отраслевые регуляторы блокируют такие интеграции при проверке.
Сколько это стоит на практике
Возьмём типичный сценарий из практики: AI-ассистент клиентской поддержки + AI-помощник для составления документов, 50 000 обращений в месяц, средний размер диалога — 5k токенов входа, 1k токенов выхода. Итого в месяц: 250M токенов входа и 50M токенов выхода.
Модель
Стоимость в мес (без скидок и оптимизаций)
YandexGPT 5 Pro
~280 000 ₽
GigaChat 3 Ultra
~220 000 ₽ (в коммерческом предложении может быть в 1,5–2 раза ниже)
DeepSeek V4-Pro
~30 000 ₽ (со скидкой 75% до 31.05.26 — 7 500 ₽)
DeepSeek V4-Flash
~7 000 ₽ (со скидкой — 2 000 ₽)
Разница огромная, но за неё вы платите юридическим риском, потерей права на госконтракты и необходимостью отдельной compliance-работы. На практике большинство наших клиентов в РФ берут гибридную схему: GigaChat/YandexGPT для всего, где есть клиентские ПДн, DeepSeek для внутренних аналитических задач без ПДн.
Чек-лист выбора
Пробегитесь по этим 8 пунктам до того, как подписывать договор:
Есть ли в задаче персональные данные клиентов? Если да — РФ-хостинг обязателен.
Нужен ли длинный контекст (>128k)? Если да — DeepSeek или Claude через API; среди российских — пока нет.
Возможен ли в перспективе госконтракт или работа в регулируемой отрасли? Если да — только Yandex/Сбер.
Какой объём запросов в месяц? Если меньше 10M токенов — разница в цене незаметна, берите по удобству.
Нужно ли fine-tuning под ваши данные? Если да — YandexGPT (self-service) или подождите Сбер.
Нужен ли no-code-конструктор для быстрого старта? Если да — ГигаЧат Бизнес или сторонние платформы поверх YandexGPT.
Готовы ли тратить юр.ресурс на дополнительное уведомление РКН по ст. 12? Если нет — DeepSeek мимо.
Есть ли стабильная инфраструктура для регресс-тестов промптов? Если нет — закладывайте 1–2 недели на её сборку, чтобы не словить «тихую» деградацию после обновления модели.
Если кратко
В мае 2026 у российского бизнеса три рабочих варианта:
YandexGPT 5 Pro — баланс качества, цены и юридической предсказуемости. Подходит большинству. Хорошие fine-tuning и batch.
GigaChat 3 Ultra + ГигаЧат Бизнес — самый быстрый старт для нетехнических команд за счёт no-code-конструктора. Прозрачен для госсектора. Цены менее прозрачны.
DeepSeek V4-Pro/Flash — кратно дешевле и с длинным контекстом, но требует отдельной compliance-работы при ПДн и не подходит для регулируемых отраслей.
Гибридная схема (DeepSeek для внутренних публичных задач + YandexGPT/GigaChat для ПДн-сценариев) — стандарт практики осторожных команд в 2026.
Если не уверены, что выбрать под конкретный кейс — нам это первое, что мы выясняем на AI-аудите: три недели работы, карта проекта, расчёт стоимости на ваших данных, без вендор-лока в выводах. Это дешевле, чем переделывать пайплайн после первой проверки РКН или после первой счёт-фактуры от LLM-провайдера, которая в 5 раз больше ожидаемой.
Источники и нормативная база
Все нормы и тарифы сверены с первичными источниками на 14 мая 2026.
Если в статье найдёте устаревшее утверждение или несоответствие текущим тарифам — напишите команде, исправление выйдет с обновлением dateModified в schema. Тарифы LLM-провайдеров меняются часто, мы перепроверяем их минимум раз в квартал. См. также наши предыдущие материалы по выбору архитектуры: RAG или fine-tuning, Llama 3.3 vs GPT-4, Kubernetes для LLM: когда нужен.
🎁
Дочитали? Возьмите промо-код
Тем, кто разобрался в теме до конца, открываем доступ к DocAssist DocAssist Pro на 30 дней — всё, что описано выше (compliance-сканер сайта, анализ договоров, генератор ответов, чат с AI), без оплаты на пробный период.