Установленный порог «сообщать при просадке на 20%» не работает. В пятницу вечером для B2B сайта просадка трафика на 50% — это норма. Во вторник утром такое же падение — катастрофа.
1. Статистический подход (Z-Score)
STRIX формирует baseline (базовую линию) на основе исторических данных за 30 дней. Мы сравниваем текущий понедельник не со вчерашним воскресеньем, а со всеми предыдущими понедельниками в это же время.
Мы используем Z-оценку (отклонение от среднего в стандартных отклонениях). Если трафик упал на 3 Sigma — это повод для уведомления.
2. Машинное обучение (Isolation Forest)
Но что если есть более сложный паттерн многомерных аномалий: трафик упал слегка, но конверсия на десктопе обвалилась полностью?
Для поиска таких выбросов в многомерном пространстве параметров (устройство, канал, цель) мы применяем алгоритм Isolation Forest. Он отлично находит аномалии в зашумленных веб-данных.
3. Финальный фильтр через LLM (Gemini Flash)
Здесь начинается магия. Когда статистическая модель ловит аномалию, ее сырые данные (json) отправляются в быструю LLM (Gemini 1.5 Flash).
Зачем здесь нейросеть?
- Контекст: LLM может сопоставить метрики («упал трафик с Яндекс Директа, но органический трафик в норме — значит проблема, скорее всего, в бюджете рекламного кабинета, а не в сервере»).
- Человеческий язык: LLM пишет текст уведомления, который читается как сообщение от аналитика.
- Отсев мусора: LLM выступает агентом-цензором, который по промптам отбраковывает маловажные отклонения.
Итог: Совместив дешёвую статистику для мониторинга 24/7 и LLM для генерации финальной находки, мы смогли обеспечить корпоративное качество уведомлений по цене пары чашек кофе в месяц.