AI-ассистенты,
которые понимают бизнес
Корпоративные чат-боты на LLM с доступом к вашим документам, CRM и базам знаний. Без галлюцинаций, с контролем ответов и логами.
- запуск MVP
- 4–6 нед
- нагрузки на поддержку
- −40%
- доступность
- 24/7
Знакомо? Работаем именно с этим
Поддержка не справляется
Повторяющиеся вопросы забивают команду, SLA тикетов растёт, клиенты уходят в чат-боты конкурентов.
База знаний мёртвая
Документация есть, но сотрудники её не читают. Онбординг занимает недели, ответы приходят с задержкой.
Обычный ChatGPT — не вариант
Данные клиентов и документы нельзя отправлять в публичные API. Нужен контур, который остаётся у вас.
Готовые конструкторы ограничены
Tilda- и Jivo-боты работают по скриптам. Реальный диалог с контекстом они не ведут.
Что входит в разработку
LLM с RAG по вашим данным
Подключаем Llama 3, Mistral, YandexGPT или GigaChat. Ассистент отвечает по вашим документам, а не выдумывает.
Интеграции с бизнес-системами
CRM (Bitrix24, amoCRM), Helpdesk, 1С, внутренние API. Ассистент создаёт тикеты, заявки, отчёты.
On-premise или частное облако
Разворачиваем на ваших серверах или в изолированном контуре. Никакой отправки данных наружу.
Каналы общения
Telegram, WhatsApp, виджет на сайте, Teams, Slack. Единое ядро — много фронтов.
Контроль качества ответов
Гардрейлы, политики, логирование, ручная модерация спорных кейсов, A/B-тесты промптов.
Аналитика и дообучение
Дашборды с темами запросов, провалами, конверсиями. Регулярное дообучение на реальных диалогах.
Путь от брифа до запуска
Бриф и данные
Разбираем сценарии, собираем корпус документов и диалогов. 3–5 дней.
MVP с RAG
Поднимаем ассистента на ваших данных, подключаем основной канал. 2–3 недели.
Интеграции и приёмка
Подключаем CRM и внутренние системы, замеряем качество, настраиваем гардрейлы. 1–2 недели.
Запуск и развитие
Переводим в production, мониторим, дообучаем. Поддержка по SLA.
Технологии
- Llama 3.1/3.3
- Mistral
- YandexGPT
- GigaChat
- Qwen 2.5
- LangChain
- LlamaIndex
- Qdrant
- PGVector
- ChromaDB
- Docker
- Kubernetes
- vLLM
- Ollama
- Nginx
- Bitrix24
- amoCRM
- 1С
- Telegram Bot API
- WhatsApp Business
Пакеты разработки
Окончательная смета формируется после диагностики. Ниже — типовые варианты.
MVP-ассистент
Простой корпоративный бот на одной LLM. Без глубокой работы с документами.
- 1 LLM (облачная или локальная)
- 1 канал: Telegram или виджет на сайт
- До 10 сценариев / FAQ-блоков
- Базовая аналитика
- Деплой на вашу VM или в наш контур
Ассистент с RAG
Полноценный ассистент, который отвечает по вашим документам и базе знаний.
- 1 LLM + RAG по корпусу документов
- 1 канал (Telegram, виджет или мессенджер)
- Гардрейлы и логирование всех ответов
- Дашборд с темами и качеством
- 1 месяц поддержки после запуска
Корпоративный
Если ассистент должен работать сразу в нескольких каналах и интегрироваться с CRM/Helpdesk.
- 2 канала общения
- Интеграция с CRM (Bitrix24, amoCRM) или Helpdesk
- Продвинутые гардрейлы, модерация
- Дашборды качества и конверсии
- 1 месяц поддержки + обучение вашей команды
Как это работает у клиентов
B2B-платформа
Ассистент закрывает типовые обращения 1-й линии, операторы фокусируются на сложных кейсах.
EdTech
AI-тьютор помогает студентам ночью и в выходные — раньше эти вопросы просто терялись.
Что спрашивают чаще всего
Ассистент будет «выдумывать» ответы?
Нет. Мы используем RAG и гардрейлы: если в документах нет ответа, ассистент честно говорит об этом и предлагает оператора. Все ответы логируются.
Данные уйдут в OpenAI или Сбер?
Только если вы сами выберете этот сценарий. По умолчанию рекомендуем on-premise LLM (Llama/Mistral/Qwen) — данные не покидают ваш контур.
Сколько стоит поддержка после запуска?
Три уровня: • Базовая — от 15 000 ₽/мес. Мониторинг, реакция на инциденты в рабочее время, мелкие правки до 4 часов в месяц. • Стандарт — от 45 000 ₽/мес. Мониторинг, доработки до 15 часов в месяц, регулярное дообучение моделей, ежеквартальный отчёт. • Расширенная — от 120 000 ₽/мес. Выделенная часть инженера, SLA по договору, дежурство по расписанию.
Можно ли дообучить под наш стиль общения?
Да. Используем few-shot промпты и при необходимости LoRA fine-tuning на ваших реальных диалогах с клиентами.
Начните с экспресс-диагностики
15 000 ₽, 3–5 рабочих дней. Разберём вашу задачу и дадим письменные рекомендации: с какого сценария начать, какая архитектура подойдёт, какой бюджет реалистичен. Если зайдём в проект — стоимость засчитываем в счёт первого этапа.