До недавнего времени «интеллектуальный сайт» означал форму обратной связи, которая не падает с ошибкой 500. Сегодня это означает другое: посетитель заходит на сайт, задаёт вопрос на естественном языке — и получает осмысленный ответ. Не ссылку на раздел FAQ, не «ваш запрос принят, ожидайте звонка», а конкретный результат: цену, рекомендацию, подобранный продукт.
Мы в Madseven за последний год внедрили несколько таких решений для клиентов — и накопили достаточно опыта, чтобы рассказать без хайпа: что реально работает, сколько это стоит и где спрятаны грабли.
Сценарий 1. ИИ-менеджер в чате
Самый очевидный кейс — и самый полезный, если сделать правильно.
Обычный чат-бот на сайте работает по дереву сценариев: «Выберите раздел → Выберите подраздел → Вот частый вопрос → Не помогло? Оставьте заявку». Посетитель с нестандартным запросом застревает на втором шаге.
ИИ-менеджер работает иначе. Он понимает вопрос в свободной формулировке, поднимает информацию из базы знаний, CRM и каталога — и даёт ответ. Не «ожидайте оператора», а «вот три тарифа, которые подходят под вашу задачу, сравнение по цене и срокам».
Реальные цифры из индустрии: после внедрения ИИ-бота техподдержка «Ростелеком-ЦОД» сократила время реакции на обращения в 10 раз, сэкономила более 20 млн рублей на ФОТ и освободила половину сотрудников от рутины. Бот закрывает до 87% типовых запросов без участия человека.
Что важно: такой чат требует интеграции с вашими внутренними системами. Без подключения к CRM и каталогу это просто ChatGPT в окошке — красиво, но бесполезно.
Сценарий 2. Калькулятор услуг
Классический калькулятор на сайте — это жёстко запрограммированная форма: выбираешь параметры из выпадающих списков, получаешь цифру. Минус в том, что он работает только для тех вариантов, которые предусмотрел разработчик.
ИИ-калькулятор принимает запрос на естественном языке: «Сколько будет стоить разработка лендинга с анимацией и формами захвата?» — и выдаёт расчёт, объясняя, из чего складывается цена. Может уточнять детали: «Вам нужна интеграция с CRM или достаточно форм? Это влияет на стоимость в два раза».
Главное преимущество: калькулятор не привязан к жёсткой структуре. Он адаптируется под запрос, а не наоборот. Для сложных услуг — стройка, ремонт, ИТ-аутсорсинг, креативные услуги — это принципиально меняет опыт клиента.
Сценарий 3. Умный поиск по сайту
Стандартный поиск по сайту ищет по ключевым словам. Если посетитель вбивает «как вернуть деньги за подписку», а в карточке товара написано «возврат средств», поиск может не найти ничего.
ИИ-поиск понимает смысл запроса. Он находит релевантные страницы, даже если формулировки не совпадают. Может собирать ответ из нескольких источников: часть информации из карточки товара, часть — из раздела FAQ, часть — из блога. Результат: один осмысленный ответ вместо списка ссылок.
По данным внутренних тестов нескольких крупных ритейлеров, ИИ-поиск увеличивает конверсию в покупку на 15–25% по сравнению с обычным поиском — просто потому, что клиент быстрее находит то, что искал.
Сценарий 4. Персональные рекомендации
Рекомендательные блоки «с этим товаром также покупают» существуют давно. Но они работают на статистике: какие товары чаще покупают вместе. ИИ-рекомендации идут дальше: они анализируют поведение конкретного посетителя в реальном времени.
Человек заходит на сайт агентства, смотрит три кейса по брендингу, читает статью про айдентику. Обычный сайт просто покажет ему популярные услуги. ИИ-вариант: «Судя по тому, что вы изучаете брендинг, вам может быть интересен наш пакет "Бренд под ключ" — вот три компании из вашей отрасли, с которыми мы это сделали».
Технически это связка из трёх компонентов: LLM формирует текст, векторная база подбирает релевантные кейсы, аналитика сессии понимает контекст. Работает быстро — ответ формируется за 1–3 секунды.
Сценарий 5. Автоматический онбординг
Для SaaS-сервисов и сложных B2B-продуктов онбординг — это боль. Пользователь регистрируется, видит пустой дашборд и не понимает, с чего начать. Welcome-письма и туториалы помогают слабо.
ИИ-онбординг адаптируется под пользователя. При регистрации задаёт 3–4 вопроса о бизнесе и целях — и сразу настраивает интерфейс под эти ответы. Вместо «вот 50 функций, разбирайтесь» — «для вашего интернет-магазина мы уже подключили интеграцию с доставкой, осталось загрузить каталог — вот инструкция на 2 минуты».
Конверсия из регистрации в первую осмысленную сессию с таким подходом вырастает кратно. Мы внедряли подобное для одного клиента из финтеха — количество пользователей, дошедших до первой транзакции, выросло на 40%.
Сценарий 6. ИИ-конфигуратор продукта
Сложные продукты с множеством опций — страховки, банковские продукты, телеком-тарифы, оборудование — мучают клиента выбором. Конфигуратор на базе ИИ задаёт уточняющие вопросы на естественном языке и собирает оптимальную конфигурацию.
Клиент не выбирает из 20 параметров, а говорит: «Мне нужен сервер для видеонаблюдения на 20 камер, с запасом по диску на месяц архива». ИИ переводит это в технические характеристики и выдаёт готовый заказ — с ценой, сроками и альтернативами.
Сколько это стоит и на чём работает
Самый практический вопрос — «какую языковую модель использовать и сколько платить». Раскладываю по трём вариантам.
Платные облачные API
Самый простой путь. Подключаете модель через API — и работаете.
- OpenAI (GPT-4o) — от $2,50 до $10 за миллион входных токенов. Качество высокое, latency минимальная. Подходит для сложных диалогов и тонкой настройки.
- Anthropic (Claude) — от $3 до $15 за миллион токенов. Хорош для длинных текстов и аналитики.
- DeepSeek — от $0,50 за миллион токенов. Серьёзная экономия при близком к лидерам качестве. Отличный вариант для русскоязычных проектов.
При среднем сайте с 500–1000 диалогов в день месячный счёт через API редко превышает $50–150.
Бесплатные и условно-бесплатные API
Можно стартовать вообще без бюджета. В 2026 году доступно 13+ платформ с постоянными бесплатными тарифами:
- OpenRouter — 20+ моделей через один API-ключ, до 50 запросов в день бесплатно. Не требует карты. Идеально для прототипа.
- Google AI Studio (Gemini) — до 1500 запросов в день, контекст до 1 млн токенов. Мощно, но данные могут использоваться для обучения (вне ЕС).
- Groq — Llama 3.3 70B на их железе, до 320 токенов в секунду. Самый быстрый бесплатный вариант.
- Mistral — до 1 млрд токенов в месяц бесплатно (с согласием на использование данных для обучения).
- Cerebras — до 1 млн токенов в день, контекст до 1 млн. Подходит для работы с документами.
Стратегия: прототип собираете на OpenRouter/Groq (бесплатно), после валидации переезжаете на платный тариф или собственный сервер.
Своё железо — open source модели
Если объём запросов большой или данные нельзя отправлять наружу:
- DeepSeek v3, Llama 3.3, Qwen 2.5, Gemma — модели, которые можно развернуть локально.
- Инструменты: Ollama (простая установка), vLLM (высокопроизводительный инференс).
- Железо: от одного сервера с GPU (RTX 4090 / A100) до кластера.
- Затраты: $0 за API, но $500–2000/мес за сервер (или $2000–10000 единоразово за свою GPU).
Практика показывает: до 1000 запросов в день проще и дешевле использовать облачные API. После этого порога локальное развёртывание начинает окупаться.
Что может пойти не так
Честно о минусах — чтобы не создавать ложных ожиданий.
Задержка. Облачные API отвечают за 1–3 секунды. Много? Для чата нормально, для поиска по сайту — на грани. Решение: стриминг ответа (токены выводятся по мере генерации) или локальная модель на Groq (0,3–0,5 сек).
Галлюцинации. Модель может придумать несуществующий тариф, цену или факт. Лечится: строгим промптом («отвечай только на основе предоставленной базы знаний»), системой RAG (retrieval-augmented generation) и валидацией ответов.
Стоимость ошибки. В чате поддержки ошибка бота исправляется извинением. В калькуляторе услуг ошибка в цене — это проблема. Вывод: все критические расчёты должны проходить двойную проверку — LLM + детерминированный алгоритм.
Безопасность данных. Если чат подключён к CRM, он видит историю клиентов. Если модель работает через внешний API, данные уходят на чужие серверы. Для проектов с персональными данными — только локальное развёртывание или сертифицированные облака (152-ФЗ).
Обслуживание. ИИ-фичи на сайте — не «поставил и забыл». Нужно мониторить качество ответов, обновлять базу знаний, докручивать промпты. В среднем, 2–4 часа в неделю после запуска.
С чего начать: три стратегии
Быстрый старт (1–3 дня). Подключаете OpenRouter API, встраиваете виджет чата на сайт, загружаете базу знаний из FAQ и описаний услуг. Цена: $0 на старте. Результат: базовый ИИ-менеджер на сайте за выходные.
Профессиональное внедрение (2–4 недели). Интеграция с CRM, каталогом и платёжной системой. Кастомные сценарии: калькулятор, конфигуратор, онбординг. Модель: платный API (GPT-4o или Claude). Цена: $100–300/мес + разработка.
Корпоративный контур (1–3 месяца). Локальное развёртывание модели на своём железе. Полный контроль над данными. Кастомная аналитика ответов и постоянное обучение на реальных диалогах. Цена: от 500 000 ₽ единоразово + обслуживание.
Главное
Внедрение ИИ в сайт — не про «добавить модную фичу». Это про то, чтобы сайт начал работать как сотрудник: отвечать на вопросы, считать, подбирать, рекомендовать, вести по продукту. Не вместо людей — а в те моменты, когда люди спят, заняты или их просто не хватает.
Технологии для этого есть уже сегодня. Бесплатные LLM позволяют собрать прототип за пару дней. Платные API дают качество, сравнимое с живым менеджером. А главное — окупается это не абстрактным «повышением лояльности», а конкретным рублём: меньше пропущенных заявок, выше конверсия, ниже нагрузка на поддержку.
Самый частый вопрос, который я слышу от клиентов: «А не рано? Может, подождать, пока технология устаканится?» Мой ответ: вот ровно сейчас ваши конкуренты читают эту статью и думают то же самое. Кто начнёт первым — тот и снимет сливки.