Поиск
- wikichaos engineering
# chaos engineering ## Определение Методология тестирования устойчивости системы путём преднамеренного внесения сбоев (задержки, ошибки API, отказы компонентов) для выявления слабых мест…
- wikiSteady State
# Steady State ## Определение Набор метрик, описывающих正常工作 системы, от которого отталкиваются в chaos engineering. ## Где встречается - [[384. Как вы проводим chaos…
- wikifault injection
…Реализовать chaos testing для агента|98. Реализовать chaos testing для агента]] - [[124. Настроить SLA между агентами|124. Настроить SLA между…
- wikiChaos Toolkit
# Chaos Toolkit ## Определение Фреймворк для проведения chaos engineering экспериментов, поддерживающий различные типы сбоев (HTTP, инфраструктурные). ## Где встречается - [[148. Реализовать simulation…
- wikiToxiproxy
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[124. Настроить SLA…
- answerКак вы проводите chaos engineering для RAG системы?
…Без [[Вики/chaos engineering\|chaos engineering]] вы узнаёте о проблемах только в продакшене, когда пользователи жалуются. [[Вики/chaos engineering\|Chaos…
- wikiembedding API
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[524. Как вы…
- answerЧто такое «chaos testing» для агента (внезапно API вернул ошибку)?
…Определение chaos testing в контексте AI-агентов **[[Вики/chaos engineering\|Chaos testing]]** (или **[[Вики/chaos engineering\|Chaos Engineering]]**) — практика, заимствованная…
- wikiretry
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[404. Что такое…
- wikiThundering Herd
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[815. Что такое…
- wikiLatency injection
# Latency injection ## Определение Техника chaos engineering, искусственно увеличивающая задержки для проверки устойчивости системы к таймаутам. ## Где встречается - [[832. Как проектировать…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить chaos testing для AI-агента
…Напишите краткий [[Вики/chaos engineering\|chaos testing]] report (в [[Вики/README.md\|README.md]]) со структурой: - Цель - Описание эксперимента - Результаты…
- wikijitter
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[830. Как проектировать…
- wikistructured logging
…Как Harness Engineering связан с наблюдаемостью (OpenTelemetry, LangSmith, трассировка)|754. Как Harness Engineering связан с наблюдаемостью (OpenTelemetry, LangSmith, трассировка)]] - [[Практика…
- wikiGremlin
# Gremlin ## Определение Платформа chaos engineering для внесения сбоев при тестировании устойчивости агентов, а также язык запросов для графовых баз данных…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать chaos testing для агента
…времени ожидания (таймауты) в HTTP-клиентах | | 431 | Chaos Engineering: принципы и инструменты (chaostoolkit) | | 567 | Обработка ошибок в LLM-агентах | | 610…
- wikiSuccess rate
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[393. Как вы…
- wikiCrewAI
…Что такое Coordination Engineering и чем он отличается от Harness Engineering|753. Что такое Coordination Engineering и чем он отличается…
- wikicircuit breaker
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[404. Что такое…
- wikiLLM endpoint
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[406. Что такое…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать circuit breaker на вызовы агента
…пропустить один [[Вики/Prompt engineering\|запрос]]; если он успешен → CLOSED, если [[Вики/Failure mode\|ошибка]] → OPEN. 2. Добавить потокобезопасность через…
- wikiключевой поиск
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[404. Что такое…
- wikicaching
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] - [[780. Как измерять ROI от…
- wikiexponential backoff
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[404. Что такое…
- wikitimeout
…Что такое Delegation Engineering и чем он отличается от Harness Engineering|760. Что такое Delegation Engineering и чем он отличается…
- wikiError rate
…Как выглядит process operational excellence в Harness Engineering (ORR, Operational Reviews)|756. Как выглядит process operational excellence в Harness Engineering…
- wikihealth check
…Как выглядит process operational excellence в Harness Engineering (ORR, Operational Reviews)|756. Как выглядит process operational excellence в Harness Engineering…
- answerКак вы делаете multi-region failover с RTO <5 минут?
…Тестирование и Chaos Engineering Регулярные тесты failover обязательны. Подходы: - GameDays — запланированные учения, где симулируется отказ региона. - **Chaos Engineering** — инструменты (Chaos…
- answerКак тестировать fallback и graceful degradation?
…при unit-тестах заменяйте реальные вызовы на имитацию (mock) с нужным поведением (поднять исключение, вернуть garbage). - **Chaos Engineering**: для интеграционных…
- answerКак вы проектируете disaster recovery для LLM системы при сбое региона?
…Тестирование DR (Chaos Engineering) Без регулярного тестирования план DR остаётся теоретическим. Инструменты: - [[Вики/Chaos Mesh\|Chaos Mesh]] — симуляция отказа региона…
- wikibaseline
…Как в Harness Engineering реализована эвалюация и дрейф (evaluation & drift)|748. Как в Harness Engineering реализована эвалюация и дрейф (evaluation…
- wikirate limiting
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[404. Что такое…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить SLA между агентами
…метрики и алерты | | 112 | Fallback-стратегии при недоступности сервиса | | 134 | Chaos engineering для тестирования отказоустойчивости | | 156 | Проектирование API с учётом…
- wikiagent
…Как Harness Engineering помогает решить проблему гарантий исполнения в критических миссиях (mission-critical)|752. Как Harness Engineering помогает решить проблему…
- wikigraceful shutdown
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[404. Что такое…
- wikiPrometheus
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[385. Как вы…
- wikiRedis
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[389. Как вы…
- wikiQdrant
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[389. Как вы…
- wikifallback model
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[385. Как вы…
- answerКак проектировать graceful degradation при отказе LLM API?
…provider" in response.json() # проверяем, что указан источник ``` ### Chaos engineering (Gremlin / Chaos Mesh) - Регулярно отключать один из провайдеров и проверять…
- answerКак вы делаете агента "отказоустойчивым" (graceful degradation)?
…Тестирование отказоустойчивости Используйте **[[Вики/chaos engineering\|chaos engineering]]** для агентов: намеренно отключайте [[Вики/Внешние API\|внешние API]], задерживайте ответы, возвращайте…
- answerКак выглядит process operational excellence в Harness Engineering (ORR, Operational Reviews)?
…скрипт (например, перезапуск подов, увеличение реплик). - [[Вики/fault injection\|Chaos engineering]] — регулярные эксперименты с внесением отказов (выключение узлов, сетевые задержки…
- answerКак вы автоматизируете rollback при деградации качества?
…Как вы проводим chaos engineering для RAG системы\|384]] | Как вы мониторите качество Agentic RAG в production? | | [[386. Как вы…
- answerКак вы делаете agent robustness к missing API (когда инструмент временно недоступен)?
…Тестирование устойчивости (chaos engineering) Для проверки [[Вики/robustness\|robustness]] проводят [[Вики/fault injection\|chaos testing]]: - Искусственно отключают [[Вики/Primary\|primary…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать simulation testing для AI-агента
…использование счётчиков в тестах | | 267 | Chaos engineering для REST API на практике | | 320 | CI/CD pipeline для Python: pytest + GitHub…
- answerКак вы определяете SLO и SLA для LLM сервиса?
…Как вы проводим chaos engineering для RAG системы\|384]] | Как управлять версиями моделей (model registry, A/B тесты) | | [[385. Как…
- answerКак организовать multi-region active-passive для LLM API?
…Тестирование failover Регулярно проводить Chaos Engineering Game Days: - Выключить активный регион (убить процесс LLM или отключить сеть). - Измерить RTO и…
- answerЧто такое «simulation testing» (тестирование в симулированной среде)?
…Например, [[Вики/simulator\|симулятор]] рекомендательной системы возвращает заранее заданные топ-N товаров. ### 3.4 Chaos Engineering for Agents Более продвинутая…
- indexПРАКТИЧЕСКИЙ ЧЕКЛИСТ: СТАFF+ AI SYSTEMS ENGINEERING
…195 | | 383 | Error budget | Exist 254, C 131 | | 384 | Chaos engineering | Q 153, Dist 191 | | 385 | Auto-rollback | Q 150…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать retry storm mitigation (exponential backoff + jitter)
…under cascading failures | | #311 | Graceful degradation in microservices | | #401 | Chaos engineering: testing retry storms | | #567 | Observability: logging and metrics for…