canary deployment
canary deployment
Определение
Стратегия постепенного развёртывания новой версии модели или промпта, при которой на начальном этапе трафик перенаправляется на новую версию в малом объёме (например, 5%). В процессе мониторинга метрик происходит плавное увеличение доли до 100% или автоматический откат при ухудшении показателей.
Где встречается
- 61. Как вы разворачиваете LLM в production (self-hosted)
- 69. Как вы организуете CICD для RAG-пайплайна
- 76. Как вы делаете AB тестирование двух моделей в production
- 79. Как вы обновляете embedding модель без полной переиндексации
- 109. Как вы бенчмарките DSPy против ручного промпт-инжиниринга в production
- 140. Как вы проверяете, что новая версия модели не сломала старые кейсы
- 166. Назовите 7 production failure modes для agentic AI систем по PAEF (Pandey, 2026).
- 179. Как вы AB тестируете агентов в production
- 243. Как вы делаете blue-green deployment для RAG системы с zero downtime
- 381. Как вы определяете SLO и SLA для LLM сервиса
- 382. Как вы проектируете canary deployment для LLM модели
- 385. Как вы автоматизируете rollback при деградации качества
- 391. Как вы проектируете агента, который может работать непрерывно (247) без дрейфа поведения
- 392. Что такое «agentic mesh» (сеть взаимодействующих агентов) и как вы его дебажите
- 410. Как вы делаете blue-green deployment для RAG системы с zero downtime
- 430. Как вы делаете canary analysis для новой LLM модели
- 505. Как вы проверяете, что новая версия модели не сломала старые кейсы
- 519. Как вы делаете backfill эмбеддингов при смене embedding модели
- 757. Какие инструменты и фреймворки существуют для Harness Engineering
- 769. Как тестировать delegation paths (интеграционное тестирование multi-agent)
- 790. Что такое «canary testing» для агентов (10% трафика на новую версию)
- 799. Как интегрировать тестирование агентов в CICD
- 800. Что такое Prompt Registry (каталог промптов с версиями)
- 801. Как делать AB тестирование промптов в production
- 803. Как делать canary deployment для промптов (5% трафика)
- 804. Как делать rollback промпта (auto-rollback при деградации метрик)
- 809. Как управлять версиями промптов в production (best practices)
- 825. Что такое autoscaling inference и как его настроить
- 896. Как сделать агента самовосстанавливающимся (self-healing)
- Практика
- 800+ вопросов
- 91. Написать postmortem для retrieval degradation
- 164. Настроить canary deployment промптов
- 170. Настроить version tagging
- 173. Реализовать prompt lifecycle
- 192. Настроить autoscaling для LLM сервера
- 202. Настроить health checks для LLM