ИИ внутри сайта: 6 сценариев интеграции, которые работают в 2026

До недавнего времени «интеллектуальный сайт» означал форму обратной связи, которая не падает с ошибкой 500. Сегодня это означает другое: посетитель заходит на сайт, задаёт вопрос на естественном языке — и получает осмысленный ответ. Не ссылку на раздел FAQ, не «ваш запрос принят, ожидайте звонка», а конкретный результат: цену, рекомендацию, подобранный продукт.

Мы в Madseven за последний год внедрили несколько таких решений для клиентов — и накопили достаточно опыта, чтобы рассказать без хайпа: что реально работает, сколько это стоит и где спрятаны грабли.

Сценарий 1. ИИ-менеджер в чате

Самый очевидный кейс — и самый полезный, если сделать правильно.

Обычный чат-бот на сайте работает по дереву сценариев: «Выберите раздел → Выберите подраздел → Вот частый вопрос → Не помогло? Оставьте заявку». Посетитель с нестандартным запросом застревает на втором шаге.

ИИ-менеджер работает иначе. Он понимает вопрос в свободной формулировке, поднимает информацию из базы знаний, CRM и каталога — и даёт ответ. Не «ожидайте оператора», а «вот три тарифа, которые подходят под вашу задачу, сравнение по цене и срокам».

Реальные цифры из индустрии: после внедрения ИИ-бота техподдержка «Ростелеком-ЦОД» сократила время реакции на обращения в 10 раз, сэкономила более 20 млн рублей на ФОТ и освободила половину сотрудников от рутины. Бот закрывает до 87% типовых запросов без участия человека.

Что важно: такой чат требует интеграции с вашими внутренними системами. Без подключения к CRM и каталогу это просто ChatGPT в окошке — красиво, но бесполезно.

Сценарий 2. Калькулятор услуг

Классический калькулятор на сайте — это жёстко запрограммированная форма: выбираешь параметры из выпадающих списков, получаешь цифру. Минус в том, что он работает только для тех вариантов, которые предусмотрел разработчик.

ИИ-калькулятор принимает запрос на естественном языке: «Сколько будет стоить разработка лендинга с анимацией и формами захвата?» — и выдаёт расчёт, объясняя, из чего складывается цена. Может уточнять детали: «Вам нужна интеграция с CRM или достаточно форм? Это влияет на стоимость в два раза».

Главное преимущество: калькулятор не привязан к жёсткой структуре. Он адаптируется под запрос, а не наоборот. Для сложных услуг — стройка, ремонт, ИТ-аутсорсинг, креативные услуги — это принципиально меняет опыт клиента.

Сценарий 3. Умный поиск по сайту

Стандартный поиск по сайту ищет по ключевым словам. Если посетитель вбивает «как вернуть деньги за подписку», а в карточке товара написано «возврат средств», поиск может не найти ничего.

ИИ-поиск понимает смысл запроса. Он находит релевантные страницы, даже если формулировки не совпадают. Может собирать ответ из нескольких источников: часть информации из карточки товара, часть — из раздела FAQ, часть — из блога. Результат: один осмысленный ответ вместо списка ссылок.

По данным внутренних тестов нескольких крупных ритейлеров, ИИ-поиск увеличивает конверсию в покупку на 15–25% по сравнению с обычным поиском — просто потому, что клиент быстрее находит то, что искал.

Сценарий 4. Персональные рекомендации

Рекомендательные блоки «с этим товаром также покупают» существуют давно. Но они работают на статистике: какие товары чаще покупают вместе. ИИ-рекомендации идут дальше: они анализируют поведение конкретного посетителя в реальном времени.

Человек заходит на сайт агентства, смотрит три кейса по брендингу, читает статью про айдентику. Обычный сайт просто покажет ему популярные услуги. ИИ-вариант: «Судя по тому, что вы изучаете брендинг, вам может быть интересен наш пакет "Бренд под ключ" — вот три компании из вашей отрасли, с которыми мы это сделали».

Технически это связка из трёх компонентов: LLM формирует текст, векторная база подбирает релевантные кейсы, аналитика сессии понимает контекст. Работает быстро — ответ формируется за 1–3 секунды.

Сценарий 5. Автоматический онбординг

Для SaaS-сервисов и сложных B2B-продуктов онбординг — это боль. Пользователь регистрируется, видит пустой дашборд и не понимает, с чего начать. Welcome-письма и туториалы помогают слабо.

ИИ-онбординг адаптируется под пользователя. При регистрации задаёт 3–4 вопроса о бизнесе и целях — и сразу настраивает интерфейс под эти ответы. Вместо «вот 50 функций, разбирайтесь» — «для вашего интернет-магазина мы уже подключили интеграцию с доставкой, осталось загрузить каталог — вот инструкция на 2 минуты».

Конверсия из регистрации в первую осмысленную сессию с таким подходом вырастает кратно. Мы внедряли подобное для одного клиента из финтеха — количество пользователей, дошедших до первой транзакции, выросло на 40%.

Сценарий 6. ИИ-конфигуратор продукта

Сложные продукты с множеством опций — страховки, банковские продукты, телеком-тарифы, оборудование — мучают клиента выбором. Конфигуратор на базе ИИ задаёт уточняющие вопросы на естественном языке и собирает оптимальную конфигурацию.

Клиент не выбирает из 20 параметров, а говорит: «Мне нужен сервер для видеонаблюдения на 20 камер, с запасом по диску на месяц архива». ИИ переводит это в технические характеристики и выдаёт готовый заказ — с ценой, сроками и альтернативами.

Сколько это стоит и на чём работает

Самый практический вопрос — «какую языковую модель использовать и сколько платить». Раскладываю по трём вариантам.

Платные облачные API

Самый простой путь. Подключаете модель через API — и работаете.

OpenAI (GPT-4o) — от $2,50 до $10 за миллион входных токенов. Качество высокое, latency минимальная. Подходит для сложных диалогов и тонкой настройки.
Anthropic (Claude) — от $3 до $15 за миллион токенов. Хорош для длинных текстов и аналитики.
DeepSeek — от $0,50 за миллион токенов. Серьёзная экономия при близком к лидерам качестве. Отличный вариант для русскоязычных проектов.

При среднем сайте с 500–1000 диалогов в день месячный счёт через API редко превышает $50–150.

Бесплатные и условно-бесплатные API

Можно стартовать вообще без бюджета. В 2026 году доступно 13+ платформ с постоянными бесплатными тарифами:

OpenRouter — 20+ моделей через один API-ключ, до 50 запросов в день бесплатно. Не требует карты. Идеально для прототипа.
Google AI Studio (Gemini) — до 1500 запросов в день, контекст до 1 млн токенов. Мощно, но данные могут использоваться для обучения (вне ЕС).
Groq — Llama 3.3 70B на их железе, до 320 токенов в секунду. Самый быстрый бесплатный вариант.
Mistral — до 1 млрд токенов в месяц бесплатно (с согласием на использование данных для обучения).
Cerebras — до 1 млн токенов в день, контекст до 1 млн. Подходит для работы с документами.

Стратегия: прототип собираете на OpenRouter/Groq (бесплатно), после валидации переезжаете на платный тариф или собственный сервер.

Своё железо — open source модели

Если объём запросов большой или данные нельзя отправлять наружу:

DeepSeek v3, Llama 3.3, Qwen 2.5, Gemma — модели, которые можно развернуть локально.
Инструменты: Ollama (простая установка), vLLM (высокопроизводительный инференс).
Железо: от одного сервера с GPU (RTX 4090 / A100) до кластера.
Затраты: $0 за API, но $500–2000/мес за сервер (или $2000–10000 единоразово за свою GPU).

Практика показывает: до 1000 запросов в день проще и дешевле использовать облачные API. После этого порога локальное развёртывание начинает окупаться.

Что может пойти не так

Честно о минусах — чтобы не создавать ложных ожиданий.

Задержка. Облачные API отвечают за 1–3 секунды. Много? Для чата нормально, для поиска по сайту — на грани. Решение: стриминг ответа (токены выводятся по мере генерации) или локальная модель на Groq (0,3–0,5 сек).

Галлюцинации. Модель может придумать несуществующий тариф, цену или факт. Лечится: строгим промптом («отвечай только на основе предоставленной базы знаний»), системой RAG (retrieval-augmented generation) и валидацией ответов.

Стоимость ошибки. В чате поддержки ошибка бота исправляется извинением. В калькуляторе услуг ошибка в цене — это проблема. Вывод: все критические расчёты должны проходить двойную проверку — LLM + детерминированный алгоритм.

Безопасность данных. Если чат подключён к CRM, он видит историю клиентов. Если модель работает через внешний API, данные уходят на чужие серверы. Для проектов с персональными данными — только локальное развёртывание или сертифицированные облака (152-ФЗ).

Обслуживание. ИИ-фичи на сайте — не «поставил и забыл». Нужно мониторить качество ответов, обновлять базу знаний, докручивать промпты. В среднем, 2–4 часа в неделю после запуска.

С чего начать: три стратегии

Быстрый старт (1–3 дня). Подключаете OpenRouter API, встраиваете виджет чата на сайт, загружаете базу знаний из FAQ и описаний услуг. Цена: $0 на старте. Результат: базовый ИИ-менеджер на сайте за выходные.

Профессиональное внедрение (2–4 недели). Интеграция с CRM, каталогом и платёжной системой. Кастомные сценарии: калькулятор, конфигуратор, онбординг. Модель: платный API (GPT-4o или Claude). Цена: $100–300/мес + разработка.

Корпоративный контур (1–3 месяца). Локальное развёртывание модели на своём железе. Полный контроль над данными. Кастомная аналитика ответов и постоянное обучение на реальных диалогах. Цена: от 500 000 ₽ единоразово + обслуживание.

Главное

Внедрение ИИ в сайт — не про «добавить модную фичу». Это про то, чтобы сайт начал работать как сотрудник: отвечать на вопросы, считать, подбирать, рекомендовать, вести по продукту. Не вместо людей — а в те моменты, когда люди спят, заняты или их просто не хватает.

Технологии для этого есть уже сегодня. Бесплатные LLM позволяют собрать прототип за пару дней. Платные API дают качество, сравнимое с живым менеджером. А главное — окупается это не абстрактным «повышением лояльности», а конкретным рублём: меньше пропущенных заявок, выше конверсия, ниже нагрузка на поддержку.

Самый частый вопрос, который я слышу от клиентов: «А не рано? Может, подождать, пока технология устаканится?» Мой ответ: вот ровно сейчас ваши конкуренты читают эту статью и думают то же самое. Кто начнёт первым — тот и снимет сливки.

Роман Тишкин

6 сценариев интеграции ИИ в ваш сайт