Поиск
- wikiprompt observability
# prompt observability ## Определение Систематический мониторинг и анализ поведения LLM-приложений на уровне отдельных промптов для обнаружения деградации. ## Где встречается - [[807…
- wikiмониторинг в production
# мониторинг в production ## Определение Непрерывное отслеживание метрик производительности (латентность, токены, ошибки) RAG-системы в продуктивной среде для выявления проблем и…
- wikiинкрементальный расчёт
…Применяется в мониторинге логов и вычислении метрик. ## Где встречается - [[281. Настроить мониторинг дрейфа метрик|281. Настроить мониторинг дрейфа метрик]] ## Навигация…
- wikirecording rules
# recording rules ## Определение Правила предварительных вычислений агрегированных метрик, например p50, p99, в системах мониторинга типа Prometheus. ## Где встречается - [[27. Настроить…
- wikimetric drift
# metric drift ## Определение Изменение распределения метрик качества со временем, требующее мониторинга и срабатывания алертов при отклонении от baseline. ## Где встречается…
- wikiМониторинг безопасности
# Мониторинг безопасности ## Определение Непрерывное отслеживание событий безопасности, таких как частота срабатываний детекторов атак, для выявления аномалий и дрейфа угроз. ## Где…
- answerНазовите 7 production failure modes для agentic AI систем по PAEF (Pandey, 2026)?
…Понимание и [[Вики/мониторинг в production\|мониторинг]] этих режимов необходимы для построения надёжных, предсказуемых и безопасных AI-агентов в промышленной…
- wikimonitoring delegation
# monitoring delegation ## Определение Система мониторинга механизма делегирования задач между AI-агентами, отслеживающая корректность и эффективность распределения работы. ## Где встречается - [[Практика…
- wikistragglers
…Настроить tail latency amplification мониторинг|27. Настроить tail latency amplification мониторинг]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikimonitoring for LLM applications
# monitoring for LLM applications ## Определение Мониторинг LLM-приложений, включающий логирование траекторий и оценку качества генерации для выявления деградации и аномалий…
- wikitail latency amplification
…Настроить tail latency amplification мониторинг|27. Настроить tail latency amplification мониторинг]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikip99/p50 ratio
…Настроить tail latency amplification мониторинг|27. Настроить tail latency amplification мониторинг]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikicontext drift
…Что такое «prompt observability» (мониторинг эффективности промптов в production)|807. Что такое «prompt observability» (мониторинг эффективности промптов в production)]] ## Навигация…
- wikiSlack webhook
…Настроить мониторинг дрейфа метрик|281. Настроить мониторинг дрейфа метрик]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikiClickHouse
…Что такое «prompt observability» (мониторинг эффективности промптов в production)|807. Что такое «prompt observability» (мониторинг эффективности промптов в production)]] - [[Практика…
- wikiinfrastructure cost
# infrastructure cost ## Определение Infrastructure cost (инфраструктурные затраты) — совокупность расходов на хостинг агента, GPU, логирование, сеть и мониторинг, учитываемых при оценке…
- wikiSLI
# SLI ## Определение Измеряемые метрики (latency, faithfulness, availability) уровня обслуживания, используемые для мониторинга выполнения SLO и SLA. ## Где встречается - [[381. Как…
- wikialert rules
…Настроить tail latency amplification мониторинг|27. Настроить tail latency amplification мониторинг]] - [[262. Настроить дашборд для failures|262. Настроить дашборд для…
- wikiPromQL
# PromQL ## Определение Язык запросов для Prometheus, используемый для извлечения и агрегации метрик мониторинга, например, latency percentiles и error rate. ## Где…
- wikiAirflow
# Airflow ## Определение Платформа для оркестрации рабочих процессов, мониторинга и повторных попыток выполнения DAG, часто используется для batch-пайплайнов и ETL…
- wikiRule-based classifier
…Настроить мониторинг дрейфа метрик|281. Настроить мониторинг дрейфа метрик]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikiCloudWatch
# CloudWatch ## Определение Сервис мониторинга и логирования AWS, применяемый для отслеживания прерываний spot instances, метрик использования ресурсов и мониторинга нагрузки при…
- wikitraces
…Настроить tail latency amplification мониторинг|27. Настроить tail latency amplification мониторинг]] - [[30. Настроить correlation между метриками|30. Настроить correlation между…
- wikicompletion rate
…Что такое «prompt observability» (мониторинг эффективности промптов в production)|807. Что такое «prompt observability» (мониторинг эффективности промптов в production)]] - [[Практика…
- wikiheatmap
…Настроить tail latency amplification мониторинг|27. Настроить tail latency amplification мониторинг]] - [[145. Сделать финансовую модель LLM-продукта|145. Сделать финансовую…
- wikihistogram_quantile
…Настроить tail latency amplification мониторинг|27. Настроить tail latency amplification мониторинг]] - [[30. Настроить correlation между метриками|30. Настроить correlation между…
- answerLangSmith — зачем и как используете?
…Она обеспечивает сквозную [[Вики/мониторинг\|наблюдаемость]] ([[Вики/мониторинг\|observability]]) цепочек вызовов, позволяет создавать [[Вики/датасеты\|датасеты]] для регрессионного тестирования, проводить…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать автоматический rollback промпта при падении faithfulness
…Свяжите [[Вики/мониторинг\|мониторинг]] и [[Вики/fallback model\|rollback]] - В скрипте `[[Вики/Monitor\|monitor]].py` при обнаружении деградации в 3…
- answerКакие 3 книги/курса вы рекомендуете по production LLM?
…управление контекстом, [[Вики/orchestration\|оркестрация]], [[Вики/мониторинг в production\|мониторинг]], [[Вики/Safetysecurity\|безопасность]], [[Вики/Version control\|версионирование]]. [[Вики/Failure mode…
- wikiCron
…Настроить мониторинг дрейфа метрик|281. Настроить мониторинг дрейфа метрик]] - [[285. Реализовать synthetic benchmark генератор|285. Реализовать synthetic benchmark генератор]] ## Навигация…
- answerКак вы измеряете drift retrieval-качества в RAG (когда документы меняются)?
…Основной подход — [[Вики/мониторинг\|мониторинг]] оффлайн-метрик ([[Вики/Hit rate\|hit rate]], [[Вики/MRR\|MRR]]) на фиксированном тестовом наборе запросов…
- wikiPrometheus Alertmanager
…Настроить tail latency amplification мониторинг|27. Настроить tail latency amplification мониторинг]] - [[29. Реализовать автоматический postmortem|29. Реализовать автоматический postmortem]] - [[47…
- wikimoving average
…Настроить мониторинг дрейфа метрик|281. Настроить мониторинг дрейфа метрик]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- answerКак вы обрабатываете production incident с LLM (playbook)?
…Detect (обнаружение через [[Вики/мониторинг\|мониторинг]]), [[Вики/блок фиксированного размера\|Page]] [[Вики/on-call\|on-call]] ([[Вики/human-in-the…
- wikiactivations
# activations ## Определение Промежуточные значения нейронов; мониторинг активаций может выявить проблемы, такие как насыщение или NaN. ## Где встречается - [[800+ вопросов|800…
- wikiInvalidation count
# Invalidation count ## Определение Метрика для мониторинга числа операций инвалидации кэша. ## Где встречается - [[257. Реализовать cache invalidation|257. Реализовать cache invalidation…
- wikidrift metrics
…Используются для мониторинга дрейфа качества. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiLangFuse
# LangFuse ## Определение Open-source платформа observability для мониторинга, трейсинга и оценки качества LLM-приложений, включая анализ затрат на токены. ## Где…
- answerКак вы логируете все вызовы LLM для аудита?
…Как вы логируете все вызовы LLM для аудита? ## Краткий тезис [[Вики/мониторинг в production\|Логирование]] всех вызовов [[Вики/LLM\|LLM…
- wikiFIRING
# FIRING ## Определение Состояние алерта в системе мониторинга Alertmanager, указывающее, что условие алерта выполняется и активен сигнал тревоги. ## Где встречается - [[129…
- wikiHighFailureRate
# HighFailureRate ## Определение Название правила алерта в системе мониторинга, срабатывающего при превышении 5% ошибочных запросов за двухминутный интервал. ## Где встречается - [[129…
- wikiKibana
# Kibana ## Определение Инструмент визуализации логов и метрик, часто используемый в связке с Elasticsearch для мониторинга и анализа данных. ## Где встречается…
- wikiMonitoring stack
# Monitoring stack ## Определение Совокупность инструментов (Prometheus, Grafana, экспортёры) для сбора и визуализации метрик системы. ## Где встречается - [[188. Настроить monitoring сообщений…
- wikiOverfitting detection
# Overfitting detection ## Определение Процесс выявления переобучения путём мониторинга расхождения между loss на обучающей и валидационной выборках. ## Где встречается - [[800+ вопросов…
- wikicollaboration_total
# collaboration_total ## Определение Счётчик общего числа отправленных запросов между агентами, используемый для мониторинга интенсивности взаимодействия. ## Где встречается - [[295. Настроить coordination…
- wikicontent_filter
# content_filter ## Определение Тип ошибки, связанный с фильтрацией контента, используемый в мониторинге отказов. ## Где встречается - [[262. Настроить дашборд для failures…
- wikiOpenMetrics
# OpenMetrics ## Определение Открытый формат экспорта метрик, используемый для мониторинга и сбора показателей работы систем в формате, совместимом с Prometheus. ## Где…
- wikiqueue length monitoring
# queue length monitoring ## Определение Процесс отслеживания длины очереди для оценки загруженности системы и эффективности механизмов backpressure. ## Где встречается - [[800+ вопросов…
- wikiTelegram
# Telegram ## Определение Кроссплатформенный мессенджер, используемый как канал для отправки алертов и уведомлений в системах мониторинга и MLOps. ## Где встречается - [[26…
- wikiAzure Monitor
# Azure Monitor ## Определение Сервис мониторинга метрик и логов в Azure, используемый для observability инфраструктуры. ## Где встречается - [[99. Написать postmortem для…