Услуга · AI-ассистенты

AI-ассистенты,
которые понимают бизнес

Корпоративные чат-боты на LLM с доступом к вашим документам, CRM и базам знаний. Без галлюцинаций, с контролем ответов и логами.

Обсудить проект Как работаем

запуск MVP: 4–6 нед
нагрузки на поддержку: −40%
доступность: 24/7

AI production

Код, а не конструкторы

Боли

Знакомо? Работаем именно с этим

Поддержка не справляется

Повторяющиеся вопросы забивают команду, SLA тикетов растёт, клиенты уходят в чат-боты конкурентов.

База знаний мёртвая

Документация есть, но сотрудники её не читают. Онбординг занимает недели, ответы приходят с задержкой.

Обычный ChatGPT — не вариант

Данные клиентов и документы нельзя отправлять в публичные API. Нужен контур, который остаётся у вас.

Готовые конструкторы ограничены

Tilda- и Jivo-боты работают по скриптам. Реальный диалог с контекстом они не ведут.

Решение

Что входит в разработку

LLM с RAG по вашим данным

Подключаем Llama 3, Mistral, YandexGPT или GigaChat. Ассистент отвечает по вашим документам, а не выдумывает.

Интеграции с бизнес-системами

CRM (Bitrix24, amoCRM), Helpdesk, 1С, внутренние API. Ассистент создаёт тикеты, заявки, отчёты.

On-premise или частное облако

Разворачиваем на ваших серверах или в изолированном контуре. Никакой отправки данных наружу.

Каналы общения

Telegram, WhatsApp, виджет на сайте, Teams, Slack. Единое ядро — много фронтов.

Контроль качества ответов

Гардрейлы, политики, логирование, ручная модерация спорных кейсов, A/B-тесты промптов.

Аналитика и дообучение

Дашборды с темами запросов, провалами, конверсиями. Регулярное дообучение на реальных диалогах.

Процесс

Путь от брифа до запуска

Шаг 01

Бриф и данные

Разбираем сценарии, собираем корпус документов и диалогов. 3–5 дней.

Шаг 02

MVP с RAG

Поднимаем ассистента на ваших данных, подключаем основной канал. 2–3 недели.

Шаг 03

Интеграции и приёмка

Подключаем CRM и внутренние системы, замеряем качество, настраиваем гардрейлы. 1–2 недели.

Шаг 04

Запуск и развитие

Переводим в production, мониторим, дообучаем. Поддержка по SLA.

Стек

Технологии

LLM

Llama 3.1/3.3
Mistral
YandexGPT
GigaChat
Qwen 2.5

RAG-ядро

LangChain
LlamaIndex
Qdrant
PGVector
ChromaDB

Инфраструктура

Docker
Kubernetes
vLLM
Ollama
Nginx

Интеграции

Bitrix24
amoCRM
1С
Telegram Bot API
WhatsApp Business

Стоимость

Пакеты разработки

Окончательная смета формируется после диагностики. Ниже — типовые варианты.

MVP-ассистент

от 120 000 ₽ единоразово · 2–3 недели

Простой корпоративный бот на одной LLM. Без глубокой работы с документами.

1 LLM (облачная или локальная)
1 канал: Telegram или виджет на сайт
До 10 сценариев / FAQ-блоков
Базовая аналитика
Деплой на вашу VM или в наш контур

Оставить заявку

Популярный

Ассистент с RAG

от 280 000 ₽ единоразово · 4–6 недель

Полноценный ассистент, который отвечает по вашим документам и базе знаний.

1 LLM + RAG по корпусу документов
1 канал (Telegram, виджет или мессенджер)
Гардрейлы и логирование всех ответов
Дашборд с темами и качеством
1 месяц поддержки после запуска

Оставить заявку

Корпоративный

от 550 000 ₽ единоразово · 6–10 недель

Если ассистент должен работать сразу в нескольких каналах и интегрироваться с CRM/Helpdesk.

2 канала общения
Интеграция с CRM (Bitrix24, amoCRM) или Helpdesk
Продвинутые гардрейлы, модерация
Дашборды качества и конверсии
1 месяц поддержки + обучение вашей команды

Оставить заявку

Примеры

Как это работает у клиентов

−40% тикетов

B2B-платформа

Ассистент закрывает типовые обращения 1-й линии, операторы фокусируются на сложных кейсах.

+25% NPS

EdTech

AI-тьютор помогает студентам ночью и в выходные — раньше эти вопросы просто терялись.

Частые вопросы

Что спрашивают чаще всего

Ассистент будет «выдумывать» ответы?

Нет. Мы используем RAG и гардрейлы: если в документах нет ответа, ассистент честно говорит об этом и предлагает оператора. Все ответы логируются.

Данные уйдут в OpenAI или Сбер?

Только если вы сами выберете этот сценарий. По умолчанию рекомендуем on-premise LLM (Llama/Mistral/Qwen) — данные не покидают ваш контур.

Сколько стоит поддержка после запуска?

Три уровня: • Базовая — от 15 000 ₽/мес. Мониторинг, реакция на инциденты в рабочее время, мелкие правки до 4 часов в месяц. • Стандарт — от 45 000 ₽/мес. Мониторинг, доработки до 15 часов в месяц, регулярное дообучение моделей, ежеквартальный отчёт. • Расширенная — от 120 000 ₽/мес. Выделенная часть инженера, SLA по договору, дежурство по расписанию.

Можно ли дообучить под наш стиль общения?

Да. Используем few-shot промпты и при необходимости LoRA fine-tuning на ваших реальных диалогах с клиентами.

Начните с экспресс-диагностики

15 000 ₽, 3–5 рабочих дней. Разберём вашу задачу и дадим письменные рекомендации: с какого сценария начать, какая архитектура подойдёт, какой бюджет реалистичен. Если зайдём в проект — стоимость засчитываем в счёт первого этапа.

Заказать диагностику mail@xencom.ru

Ответим в течение рабочего дня

AI-ассистенты, которые понимают бизнес

Знакомо? Работаем именно с этим

Поддержка не справляется

База знаний мёртвая

Обычный ChatGPT — не вариант

Готовые конструкторы ограничены

Что входит в разработку

LLM с RAG по вашим данным

Интеграции с бизнес-системами

On-premise или частное облако

Каналы общения

Контроль качества ответов

Аналитика и дообучение

Путь от брифа до запуска

Бриф и данные

MVP с RAG

Интеграции и приёмка

Запуск и развитие

Технологии

Пакеты разработки

Как это работает у клиентов

B2B-платформа

EdTech

Что спрашивают чаще всего

Начните с экспресс-диагностики

AI-ассистенты,
которые понимают бизнес