AI-ассистенты

GigaChat MAX vs YandexGPT 5 Pro vs DeepSeek: что выбрать бизнесу под 152-ФЗ в 2026

Сравниваем три актуальные LLM для российского бизнеса в мае 2026: цены, контекст, fine-tuning, юридические аспекты под 152-ФЗ и проект ФЗ о доверенных моделях ИИ. С таблицей, типовыми сценариями и расчётом стоимости на реальных нагрузках.

11 минут
AI-ассистенты
Xencom · Блог
GigaChat MAX vs YandexGPT 5 Pro vs DeepSeek: что выбрать бизнесу под 152-ФЗ в 2026

Каждый второй разговор о внедрении AI-ассистента в 2026 году начинается с одного и того же вопроса: «А подключаться к ChatGPT, к GigaChat или к YandexGPT?» — и где-то к середине обсуждения добавляется «а что там по DeepSeek, говорят дёшево». Простого ответа на этот вопрос нет — он зависит от объёма запросов, чувствительности данных, требований к локализации и того, что вы вообще собираетесь делать. Ниже — разбор по трём моделям, которые реально имеет смысл рассматривать в РФ-сегменте в мае 2026, с акцентом на 152-ФЗ и проект федерального закона о регулировании ИИ.

TL;DR

Если работаете с персональными данными граждан РФ или обслуживаете госконтракты — берите GigaChat MAX или YandexGPT 5 Pro: данные обрабатываются в РФ, обе модели формально подходят под определение «доверенной» в проекте ФЗ Минцифры (опубликован в марте 2026, обсуждение до июня). Для чистой коммерции без ПДн и с упором на цену/контекст/reasoning — DeepSeek V4-Pro/Flash в десять раз дешевле российских аналогов и не уступает им по качеству на русском, но передача данных в Китай требует отдельной юридической проработки и (для ПДн) — уведомления РКН о трансграничной передаче.

Главное

  • На рынке появилась категория «доверенных моделей» — пока в виде проекта ФЗ. Госкорпорации и крупный бизнес с 2026–2027 обязаны мигрировать на модели, прошедшие сертификацию. GigaChat и YandexGPT в эту категорию явно входят, DeepSeek и OpenAI — нет.
  • YandexGPT 5 Pro: контекст 128k токенов, reasoning-режим, fine-tuning, асинхронные батчи, цена ~50 ₽ за 1 млн токенов входа на тарифе Pro. Хорошо знает русский деловой язык, плохо — нишевые домены.
  • GigaChat 3 Ultra (релиз марта 2026): сопоставим с YandexGPT по качеству на русском, отдельно есть платформа ГигаЧат Бизнес для построения «цифровых сотрудников» с RAG и интеграцией в CRM/1C.
  • DeepSeek V4-Pro (1M токенов контекста, MoE-архитектура): на 1–2 порядка дешевле российских моделей, лучший reasoning на длинных текстах, но серверы в КНР — для ПДн без отдельных юридических оснований не подходит.
  • Все три можно собрать в одну архитектуру: GigaChat/YandexGPT для задач с ПДн, DeepSeek для обработки публичных документов и тяжёлой аналитики. Так делают серьёзные команды в 2026.

Что поменялось в 2025–2026

Два события задают ландшафт.

Первое — проект ФЗ о регулировании ИИ. В марте 2026 Минцифры опубликовало для общественного обсуждения проект федерального закона «Об основах регулирования отношений в сфере искусственного интеллекта». Ключевая для бизнеса часть — введение понятия «доверенная модель ИИ»: модель, разработанная или адаптированная отечественным разработчиком, проходящая аудит и сертификацию, с обработкой данных на инфраструктуре в РФ. Госкорпорациям и критической инфраструктуре с 2027 года обязательно использовать только такие модели.

«Государство требует от крупного бизнеса и госкорпораций переходить на доверенные модели. Это означает гарантированный спрос для таких игроков, как Сбер с GigaChat, Яндекс с YandexGPT и других участников альянса в сфере ИИ.» — обзор «Российские нейросети 2026», VC.ru, март 2026.

На остальной бизнес распространяются мягкие рекомендации, но обработка ПДн «недоверенными» моделями в существующей логике 152-ФЗ автоматически превращается в трансграничную передачу со всеми вытекающими.

Второе — выросли тарифы и качество российских моделей. В 2024 году YandexGPT 2 был «попробовать», а GigaChat — заметно слабее GPT-3.5. В мае 2026 у обоих в линейке есть флагманы (YandexGPT 5 Pro, GigaChat 3 Ultra), сопоставимые с GPT-4-class моделями на бытовых задачах на русском языке. Плюс — обе модели соответствуют требованиям 152-ФЗ из коробки: данные не покидают РФ, операторы (АО «Яндекс», АО «Сбербанк») состоят в реестре, есть готовые юридические комплекты для интеграции.

В этом контексте выбор модели — это не только техника, но и юридика.

YandexGPT 5 Pro

Что это. Линейка LLM Яндекса, доступная через Yandex Cloud Foundation Models API. В мае 2026 актуальны три модели:

  • YandexGPT 5 Lite — быстрая дешёвая, подходит для классификации, простых ответов чат-бота, генерации коротких текстов. Контекст 32k.
  • YandexGPT 5 Pro — рабочая лошадка большинства бизнес-сценариев. Контекст 128k. Хорошее качество reasoning, форматирования и инструкций.
  • YandexGPT 5 Pro (reasoning mode) — режим с пошаговым рассуждением, удлиняет ответ в 2–3 раза, повышает качество на сложных задачах (анализ договоров, проверка фактов, многошаговые расчёты).

Цена в мае 2026 (ориентировочно). Lite: 0,2 ₽ за 1k входных токенов, 0,4 ₽ за 1k выходных. Pro: 0,8 ₽ / 1,6 ₽. Reasoning — отдельный тариф, дороже на 30–50%. Есть тариф Foundation для крупных клиентов с фиксированной ценой за месяц и квотой.

Что хорошо:

  • Все данные хранятся и обрабатываются в РФ-инфраструктуре Yandex Cloud. По 152-ФЗ — никаких трансграничных вопросов.
  • Поддерживается fine-tuning через консоль (LoRA-подход, недорогой, занимает 1–4 часа на типовом датасете).
  • Хорошо знает русский деловой язык, ГОСТовое оформление, типовые тексты для отчётов и писем.
  • Асинхронный batch-режим со скидкой 50% для офлайн-задач (массовая разметка, обработка архива документов).
  • Есть встроенная интеграция со Speech Kit, Translate, Vision OCR — это упрощает сборку пайплайна обработки документов.

Что плохо:

  • На нишевых доменах (юридические нюансы, специализированная медицина, узкая инженерная тематика) уступает GPT-4 и Claude-Sonnet. Нужен RAG или fine-tuning.
  • Контекст 128k достаточный, но не рекордный для рынка — DeepSeek и обновлённый Claude дают 1M.
  • API более чем стабильный, но иногда возникают «тихие» изменения поведения моделей при обновлениях. Стоит закладывать regression-тесты для критичных промптов.

GigaChat 3 Ultra и ГигаЧат Бизнес

Что это. Семейство LLM от Сбера. На май 2026 в линейке:

  • GigaChat Lite — аналог YandexGPT Lite, быстрые простые задачи.
  • GigaChat 2 / MAX — массовый сегмент, рабочая модель для большинства задач.
  • GigaChat 3 Ultra — флагман, релиз марта 2026. Контекст 128k, заявлено сопоставимое с GPT-4 качество на русском, поддержка инструкций сложного формата (JSON-strict, schema-guided generation).

В марте 2026 Сбер запустил отдельную платформу ГигаЧат Бизнес — это не просто LLM-API, а конструктор «цифровых сотрудников»: RAG-движок поверх собственных документов клиента, интеграция с CRM (включая «Битрикс24», AmoCRM), готовые модули для интеграции с 1C, no-code-сценарии диалогов.

Цена в мае 2026 (ориентировочно). В персональной версии — бесплатно с лимитом. Бизнес-API: pay-as-you-go аналогично YandexGPT, плюс корпоративные тарифы с фиксированной квотой. ГигаЧат Бизнес — отдельные тарифы на цифрового сотрудника, исчисляемые от 30 000 ₽/мес.

Что хорошо:

  • Полностью российская инфраструктура, входит в реестр отечественного ПО.
  • Сбер активно работает с госконтрактами — для компаний, претендующих на тендеры, наличие интеграции с GigaChat — формальный плюс.
  • ГигаЧат Бизнес сильно сокращает порог входа: можно собрать корпоративный ассистент за неделю силами одного аналитика без программирования.
  • Хорошая интеграция с другими сервисами Сбера (Сбер ID, оплата, банковские API).

Что плохо:

  • Тарифы и SLA менее прозрачны, чем у Yandex Cloud. Цены в публичной документации часто отличаются от того, что вам пришлют в коммерческом предложении.
  • Fine-tuning доступен, но только корпоративным клиентам по отдельному договору. Самообслуживания, как у Яндекса, нет.
  • Скорость отдельных запросов чуть ниже, чем у YandexGPT, особенно в моменты пиковой нагрузки.
  • Документация на API менее зрелая, чем у Яндекса, особенно по edge cases.

DeepSeek V4-Pro и V4-Flash

Что это. Линейка LLM китайской компании DeepSeek, доступная по публичному API. На май 2026:

  • DeepSeek V4-Flash — быстрый и дешёвый, контекст 1M токенов. Подходит для большинства бизнес-задач, по качеству сопоставим с GPT-4 class.
  • DeepSeek V4-Pro — флагман с глубоким reasoning-режимом, показывает ход рассуждений, контекст 1M. Для сложных задач анализа, разбора длинных документов, проверки логики.

В мае 2026 продолжается скидка 75% на ввод DeepSeek-моделей (до 31 мая 2026) — что делает их экономически вне конкуренции для задач, не связанных с ПДн.

Цена в мае 2026 (ориентировочно). Flash: ~3 ¢ за 1M токенов входа, ~12 ¢ за 1M выходных. Pro: ~14 ¢ / ~55 ¢. Это в 10–30 раз дешевле YandexGPT Pro и GigaChat MAX на эквивалентных объёмах.

Что хорошо:

  • Лучшее в индустрии соотношение «цена за токен / качество ответа» на май 2026.
  • Длинный контекст 1M — позволяет за один запрос обрабатывать сотни страниц договоров или регламентов без RAG.
  • Открытые веса базовой модели — можно развернуть DeepSeek-V3 или Llama-аналог локально (см. наш разбор on-prem LLM).
  • Очень сильный reasoning, особенно в Pro-режиме — на задачах с многошаговой логикой обходит YandexGPT и GigaChat.

Что плохо:

  • API DeepSeek хостится в КНР. Любая передача персональных данных через этот API формально подпадает под трансграничную передачу по ст. 12 152-ФЗ. Без отдельного согласия субъекта и уведомления РКН — нарушение.
  • Юридическая судебная практика по «китайским LLM и 152-ФЗ» в РФ пока тонкая. РКН в публичных позициях 2025–2026 не выделял DeepSeek в особую категорию, но и официальной поддержки «доверенной модели» там нет.
  • Для госконтрактов и регулируемых индустрий (банкинг, страхование, медицина) — однозначно мимо. Только Yandex или GigaChat.
  • Поддержка русского языка хорошая, но не такая же отполированная, как у российских моделей: бывают мелкие шероховатости в стилистике, переводе терминов.

Сравнительная таблица

ПараметрYandexGPT 5 ProGigaChat 3 UltraDeepSeek V4-Pro
Контекст128k128k1M
Цена входа (1M токенов)~800 ₽~700 ₽~14 ₽ (со скидкой до 31.05)
Reasoning-режимдадада
Fine-tuningself-serviceпо договоруopen weights (only V3)
Хостинг данныхРФРФКНР
Подходит для ПДндадатребует уведомления РКН по ст. 12
«Доверенная модель» по проекту ФЗдаданет
Подходит для госконтрактовдаданет
Качество на русскомочень высокоеочень высокоевысокое
API-зрелостьвысокаясредняявысокая
Готовый no-code-конструкторнетесть (ГигаЧат Бизнес)нет

Когда что выбирать: 4 типовых сценария

Сценарий 1. AI-ассистент клиентской поддержки на сайте малого бизнеса. Пользователь оставляет имя, email, телефон — это ПДн. Берите GigaChat 2 / MAX через ГигаЧат Бизнес-платформу: быстрый старт, RAG на ваших регламентах, интеграция с CRM. Альтернатива — YandexGPT 5 Lite с самостоятельной обвязкой RAG на pgvector.

Сценарий 2. Внутренний AI-аналитик для разбора длинных документов (договоры, отчёты, базы знаний). Если работает только с внутренними документами компании без ПДн клиентов — DeepSeek V4-Pro на 1M контекста за десятую часть бюджета. Если в документах могут попадаться ПДн (договоры с физлицами, переписка с клиентами) — берите YandexGPT 5 Pro в reasoning-режиме плюс RAG.

Сценарий 3. Цифровой сотрудник для исходящих коммуникаций (письма в ФНС, претензии контрагентам, ответы регуляторам). Тут нужен максимально «русский деловой стиль» и точность по терминологии. YandexGPT 5 Pro или GigaChat 3 Ultra, с разработанным промпт-пакетом и базой шаблонов в RAG. Это сценарий, который мы решаем в собственном продукте DocAssist (попробовать в кабинете — apps.xencom.ru) — там виден предел того, что вообще достижимо на сегодняшних российских моделях. Подробнее о разнице между AI-ассистентом и полноценным AI-агентом мы разобрали в отдельной статье.

Сценарий 4. Тяжёлый PoC с массовой обработкой документов (миллионы записей, эксперимент). Когда нужно за выходные перемолоть 10 ТБ публичной нормативки или обкатать гипотезу классификации — DeepSeek V4-Flash в batch-режиме. После того как гипотеза подтвердилась, перекладывайте production-пайплайн на российскую модель.

152-ФЗ: на что обратить внимание для каждой модели

При работе с YandexGPT и GigaChat:

  • Заключите договор поручения по ч. 3 ст. 6 152-ФЗ с оператором (АО «Яндекс» или ПАО «Сбербанк» — у обоих есть типовые формы).
  • Добавьте этого обработчика в уведомление в РКН (мы подробно разбирали, как правильно).
  • В политике конфиденциальности на сайте перечислите цели передачи ПДн в LLM-сервис («автоматическая обработка обращений пользователей», «генерация ответов на запросы»).
  • Получите явное согласие пользователя на эту цель — отдельным чекбоксом, не в общем согласии (см. 9 ошибок в согласиях).
  • Свяжите выбор модели с новыми требованиями 2026 года: оборотные штрафы, обязательная УПД и ЭТТН — полный чек-лист.

При работе с DeepSeek (или любым LLM с зарубежным хостингом):

  • Это трансграничная передача по ст. 12 152-ФЗ. КНР не входит в список стран с адекватным уровнем защиты ПДн, утверждённый РКН.
  • Нужно отдельное уведомление в РКН о намерении трансграничной передачи (ч. 4 ст. 12). Подаётся через личный кабинет на pd.rkn.gov.ru, проверяется до 10 рабочих дней.
  • Согласие субъекта должно явно упоминать страну передачи: «КНР, компания DeepSeek (Hangzhou) Ltd. с целью автоматической обработки запроса».
  • Для регулируемых отраслей (банкинг, страхование, медицина, госсектор) — фактически нерабочий вариант. РКН и отраслевые регуляторы блокируют такие интеграции при проверке.

Сколько это стоит на практике

Возьмём типичный сценарий из практики: AI-ассистент клиентской поддержки + AI-помощник для составления документов, 50 000 обращений в месяц, средний размер диалога — 5k токенов входа, 1k токенов выхода. Итого в месяц: 250M токенов входа и 50M токенов выхода.

МодельСтоимость в мес (без скидок и оптимизаций)
YandexGPT 5 Pro~280 000 ₽
GigaChat 3 Ultra~220 000 ₽ (в коммерческом предложении может быть в 1,5–2 раза ниже)
DeepSeek V4-Pro~30 000 ₽ (со скидкой 75% до 31.05.26 — 7 500 ₽)
DeepSeek V4-Flash~7 000 ₽ (со скидкой — 2 000 ₽)

Разница огромная, но за неё вы платите юридическим риском, потерей права на госконтракты и необходимостью отдельной compliance-работы. На практике большинство наших клиентов в РФ берут гибридную схему: GigaChat/YandexGPT для всего, где есть клиентские ПДн, DeepSeek для внутренних аналитических задач без ПДн.

Чек-лист выбора

Пробегитесь по этим 8 пунктам до того, как подписывать договор:

  1. Есть ли в задаче персональные данные клиентов? Если да — РФ-хостинг обязателен.
  2. Нужен ли длинный контекст (>128k)? Если да — DeepSeek или Claude через API; среди российских — пока нет.
  3. Возможен ли в перспективе госконтракт или работа в регулируемой отрасли? Если да — только Yandex/Сбер.
  4. Какой объём запросов в месяц? Если меньше 10M токенов — разница в цене незаметна, берите по удобству.
  5. Нужно ли fine-tuning под ваши данные? Если да — YandexGPT (self-service) или подождите Сбер.
  6. Нужен ли no-code-конструктор для быстрого старта? Если да — ГигаЧат Бизнес или сторонние платформы поверх YandexGPT.
  7. Готовы ли тратить юр.ресурс на дополнительное уведомление РКН по ст. 12? Если нет — DeepSeek мимо.
  8. Есть ли стабильная инфраструктура для регресс-тестов промптов? Если нет — закладывайте 1–2 недели на её сборку, чтобы не словить «тихую» деградацию после обновления модели.

Если кратко

В мае 2026 у российского бизнеса три рабочих варианта:

  • YandexGPT 5 Pro — баланс качества, цены и юридической предсказуемости. Подходит большинству. Хорошие fine-tuning и batch.
  • GigaChat 3 Ultra + ГигаЧат Бизнес — самый быстрый старт для нетехнических команд за счёт no-code-конструктора. Прозрачен для госсектора. Цены менее прозрачны.
  • DeepSeek V4-Pro/Flash — кратно дешевле и с длинным контекстом, но требует отдельной compliance-работы при ПДн и не подходит для регулируемых отраслей.

Гибридная схема (DeepSeek для внутренних публичных задач + YandexGPT/GigaChat для ПДн-сценариев) — стандарт практики осторожных команд в 2026.

Если не уверены, что выбрать под конкретный кейс — нам это первое, что мы выясняем на AI-аудите: три недели работы, карта проекта, расчёт стоимости на ваших данных, без вендор-лока в выводах. Это дешевле, чем переделывать пайплайн после первой проверки РКН или после первой счёт-фактуры от LLM-провайдера, которая в 5 раз больше ожидаемой.

Источники и нормативная база

Все нормы и тарифы сверены с первичными источниками на 14 мая 2026.

Если в статье найдёте устаревшее утверждение или несоответствие текущим тарифам — напишите команде, исправление выйдет с обновлением dateModified в schema. Тарифы LLM-провайдеров меняются часто, мы перепроверяем их минимум раз в квартал. См. также наши предыдущие материалы по выбору архитектуры: RAG или fine-tuning, Llama 3.3 vs GPT-4, Kubernetes для LLM: когда нужен.

🎁

Дочитали? Возьмите промо-код

Тем, кто разобрался в теме до конца, открываем доступ к DocAssist DocAssist Pro на 30 дней — всё, что описано выше (compliance-сканер сайта, анализ договоров, генератор ответов, чат с AI), без оплаты на пробный период.

Кнопка активируется через 30 сек.

Читать дальше

Другие статьи

AI-ассистенты
Xencom · Блог
AI-агенты vs AI-ассистенты: чем они отличаются и какому бизнесу что реально нужно в 2026
18 мая 2026 г. 10 минут

AI-агенты vs AI-ассистенты: чем они отличаются и какому бизнесу что реально нужно в 2026

Разбираемся, в чём принципиальная разница между AI-ассистентом и AI-агентом, почему «агенты» — главный технологический тренд 2026 по версии Сбера и ФинТеха, и какие задачи стоит решать через одно, а какие — через другое. С таблицей, антипаттернами и расчётом бюджета.

Читать
AI-ассистенты
Xencom · Блог
RAG или fine-tuning: что выбрать для корпоративного ассистента
28 февраля 2026 г. 10 минут

RAG или fine-tuning: что выбрать для корпоративного ассистента

Разбираемся, когда дообучение LLM реально нужно, а когда достаточно RAG — и сколько стоит каждый подход в российских реалиях.

Читать
Compliance
Xencom · Блог
152-ФЗ в 2026: оборотные штрафы 3%, обязательная УПД и ЭТТН — чек-лист малого бизнеса до сентября
16 мая 2026 г. 12 минут

152-ФЗ в 2026: оборотные штрафы 3%, обязательная УПД и ЭТТН — чек-лист малого бизнеса до сентября

Разбираем три самых жёстких регуляторных удара 2025–2026 года: оборотные штрафы до 3% выручки за утечку ПДн (с 30.05.2025), переход на УПД как единственный формат первички (с 01.01.2026) и обязательная электронная транспортная накладная (с 01.09.2026). Со ссылками на нормы, реальными штрафами 2026 и чек-листом по подготовке.

Читать

Обсудим ваш AI-проект?

Расскажите о задаче — на 30-минутном звонке подскажем, с чего начать и чего избегать.