Поиск

  • wikislowlog-log-slower-than

    # slowlog-log-slower-than ## Определение Параметр конфигурации Redis, задающий порог времени выполнения команды (в микросекундах), при превышении которого команда попадает…

  • wikiSLO-driven

    # SLO-driven ## Определение Подход к выбору модели, при котором предпочтение отдаётся модели с максимальной точностью при условии соблюдения заданного SLO

  • wikislot memory

    # slot memory ## Определение Элемент компрессированной памяти фиксированного размера, хранящий агрегированную информацию о множестве предыдущих токенов. Используется в архитектурах с бесконечным…

  • wikicomposite SLO

    # composite SLO ## Определение Агрегированный SLO (Service Level Objective), рассчитываемый из нескольких метрик качества AI, например faithfulness и answer relevance. ## Где…

  • wikihierarchical SLO

    # hierarchical SLO ## Определение Иерархические SLO — это соглашения об уровне обслуживания, применяемые к каждому этапу работы агента (retrieval, вызов API, генерация…

  • answerЧто такое error budget для AI качества и как его считать?

    SLO, SLI, error budget **[[Вики/SLO\|SLO]] ([[Вики/SLO\|Service Level Objective]])** — целевой показатель качества сервиса, выраженный в процентах или…

  • wikiSLO violation rate

    # SLO violation rate ## Определение Доля запросов, превышающих заданный порог задержки (latency) или другого SLO. Метрика для мониторинга стабильности инференса и…

  • wikisequence slots

    # sequence slots ## Определение Механизм в TensorRT-LLM для параллельной обработки множества запросов путём выделения фиксированных слотов под последовательности. Позволяет эффективно…

  • wikislowlog

    # slowlog ## Определение Механизм Redis для логирования медленных команд (длительностью более заданного порога). Используется для диагностики производительности и поиска узких мест…

  • wikiSLI

    # SLI ## Определение Измеряемые метрики (latency, faithfulness, availability) уровня обслуживания, используемые для мониторинга выполнения SLO и SLA. ## Где встречается - [[381. Как…

  • wikierror budget

    # error budget ## Определение Допустимый лимит нарушений SLO (Service Level Objective), рассчитываемый как 1 − SLO. Используется для балансирования стабильности и скорости…

  • wikislot migration

    # slot migration ## Определение Процесс перемещения слотов между шардами в Redis Cluster для балансировки нагрузки или обработки горячих шардов. Выполняется с…

  • wikislot-filling

    # slot-filling ## Определение Компонент диалоговой системы, отвечающий за извлечение параметров (слотов) из запроса пользователя. Используется в агентах для выполнения функций…

  • answerКак вы определяете SLO и SLA для LLM сервиса?

    …Как вы определяете SLO и SLA для LLM сервиса? ## Краткий тезис SLO (Service Level Objective) — это целевые показатели качества сервиса…

  • wikiGauge

    …Как вы определяете SLO и SLA для LLM сервиса]] - [[26. Реализовать SLO для faithfulness|26. Реализовать SLO для faithfulness]] - [[124…

  • wikiDegradation slope

    # Degradation slope ## Определение Наклон графика accuracy в зависимости от длины контекста; показывает скорость падения качества reasoning при увеличении контекста. ## Где…

  • wikiSLO

    …Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[382…

  • wikiLogical replication slot

    # Logical replication slot ## Определение Слот в PostgreSQL, который отслеживает позицию в WAL для потоковой передачи изменений, используемый в CDC-системах…

  • wikilatency SLO

    # latency SLO ## Определение Целевой показатель времени ответа, например p95 < 500 мс, или доля ответов, укладывающихся в таймаут (99% < 2 сек…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать SLO для faithfulness

    …Пример строки: ```csv question,answer,contexts "Что такое SLO?","SLO – это целевой уровень качества сервиса...","SLO — Service Level Objective|||SLI…

  • wikiSlots

    # Slots ## Определение Параметры функции, которые модель должна заполнить на основе входных данных. В контексте fine-tuning слоты используются для генерации…

  • wikiTest stand

    # Test stand ## Определение Тестовое окружение, имитирующее production-нагрузку, для проведения нагрузочного тестирования и верификации SLO (например, faithfulness latency). ## Где встречается…

  • wikiHistogram

    …Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[24…

  • wikislowapi

    # slowapi ## Определение Библиотека для ограничения частоты запросов (rate limiting) в FastAPI. Позволяет защитить API от злоупотреблений и перегрузок. ## Где встречается…

  • wikiHugging Face CrossEncoder

    # Hugging Face CrossEncoder ## Определение Библиотека для cross-encoder моделей, используемая в двухступенчатом ретривале (fast ANN + slow cross-encoder) для RAG…

  • wikipercentile

    …Реализовать SLO для faithfulness|26. Реализовать SLO для faithfulness]] - [[238. RAG с incremental update|238. RAG с incremental update]] - [[263…

  • wikialerting rule

    # alerting rule ## Определение Правило в Prometheus, которое срабатывает при нарушении SLO или деградации качества (например, падение hit rate ниже 0…

  • wikiconfig.yaml

    # config.yaml ## Определение Файл в формате YAML, содержащий параметры настройки агента, SLO, модели эмбеддингов и других компонентов системы. ## Где встречается…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать SLO для RAG

    …Реализовать SLO для RAG ## 1. Цель задачи Научиться формализовать и мониторить [[Вики/SLO\|Service Level Objectives]] ([[Вики/SLA\|SLO]]) для…

  • wikiPet-project

    …Реализовать SLO для faithfulness|26. Реализовать SLO для faithfulness]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • wikirule_files

    …Реализовать SLO для faithfulness|26. Реализовать SLO для faithfulness]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • wikiTelegram

    …Реализовать SLO для faithfulness|26. Реализовать SLO для faithfulness]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • wikiЭвристика BERTScore

    …Реализовать SLO для RAG|254. Реализовать SLO для RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • wikiTime window

    …Реализовать SLO для faithfulness|26. Реализовать SLO для faithfulness]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • wikiThanos

    …Реализовать SLO для RAG|254. Реализовать SLO для RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • wikiBackground task

    …Реализовать SLO для RAG|254. Реализовать SLO для RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • wikiBucket resolution

    …Реализовать SLO для RAG|254. Реализовать SLO для RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • wikiscrape_interval

    …Реализовать SLO для faithfulness|26. Реализовать SLO для faithfulness]] - [[132. Настроить cost tracking в production|132. Настроить cost tracking в…

  • wikiToil reduction

    …Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] ## Навигация…

  • wikiКаскад моделей

    …Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] ## Навигация…

  • wikiscrape_config

    …Реализовать SLO для RAG|254. Реализовать SLO для RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • wikiGPU time

    …Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[800…

  • wikiNoise

    …Реализовать SLO для faithfulness|26. Реализовать SLO для faithfulness]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • answerКак вы сравниваете две модели, если у них разная latency (быстрая неточная vs медленная точная)?

    SLO-driven выбор **SLO ([[Вики/SLO\|Service Level Objective]])** — [[Вики/SLO\|целевой уровень обслуживания]], например: «[[Вики/Latency\|p95 latency]] < 500…

  • wikiSRE

    …Как вы определяете SLO и SLA для LLM сервиса|381. Как вы определяете SLO и SLA для LLM сервиса]] - [[756…

  • wikiVictoriaMetrics

    …Реализовать SLO для RAG|254. Реализовать SLO для RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • wikiSentenceTransformers

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…

  • wikiQuality degradation

    …Реализовать SLO для faithfulness|26. Реализовать SLO для faithfulness]] - [[220. Настроить wave decoding для коротких ответов|220. Настроить wave decoding…

  • wikiInfluxDB

    …Реализовать SLO для faithfulness|26. Реализовать SLO для faithfulness]] - [[109. Настроить cost tracking для агента|109. Настроить cost tracking для…

  • wikitrade-off

    …Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG|372. Как вы строите двухступенчатый ретривал (fast ANN…