English translation is not available yet. Showing Russian content.
fallback model
fallback model
Определение
Резервная модель или стратегия (например, общая LLM без RAG) при отсутствии ответа от основной модели или документов, обеспечивающая graceful degradation.
Где встречается
- 8. Как вы обрабатываете запросы, на которые нет ответа в документах
- 43. Как спроектировать агента, который может выполнять цепочку из 5-10 действий
- 50. Как вы ограничиваете бесконечный цикл агента
- 56. Как вы делаете агента отказоустойчивым (graceful degradation)
- 60. Как вы обрабатываете ошибки агента (action не сработал, API вернул ошибку)
- 65. Как вы обрабатываете rate limiting от LLM провайдеров (OpenAI, Anthropic)
- 75. Что такое structured output constrained decoding и зачем это нужно
- 76. Как вы делаете AB тестирование двух моделей в production
- 79. Как вы обновляете embedding модель без полной переиндексации
- 81. Как бы вы спроектировали систему для 1000 одновременных пользователей чат-бота с RAG
- 85. Как вы обрабатываете смену форматов документов (legacy + новые форматы)
- 89. Как вы спроектируете систему, которая может переключаться между разными LLM провайдерами без даунтайма
- 94. Как вы проектируете промпты, которые работают с разными моделями
- 109. Как вы бенчмарките DSPy против ручного промпт-инжиниринга в production
- 140. Как вы проверяете, что новая версия модели не сломала старые кейсы
- 142. Как вы проектируете «планировщика» (planner) для Agentic RAG
- 143. Как вы боретесь с «бесконечным циклом» агента в Agentic RAG
- 156. Как вы выбираете между увеличением тест-тайм компьютинга и использованием большей модели
- 174. Что такое «многошаговая когерентность» (coherence illusion) в cascading agent systems
- 237. Что такое circuit breaker и как он применяется к LLM API вызовам
- 238. Как вы реализуете retry с exponential backoff для LLM API с rate limit
- 240. Как вы проектируете dead letter queue для failed LLM инференс запросов
- 243. Как вы делаете blue-green deployment для RAG системы с zero downtime
- 247. Как вы проектируете multi-region active-active для LLM API
- 254. Как вы проектируете disaster recovery для LLM системы при сбое региона
- 272. Как вы проверяете качество parsing документов (PDF, DOCX) в production
- 359. Как вы защищаете multi-agent систему от вредоносного агента
- 382. Как вы проектируете canary deployment для LLM модели
- 383. Что такое error budget для AI качества и как его считать
- 384. Как вы проводим chaos engineering для RAG системы
- 385. Как вы автоматизируете rollback при деградации качества
- 389. Как вы делаем disaster recovery с RPO 1 минута
- 391. Как вы проектируете агента, который может работать непрерывно (247) без дрейфа поведения
- 393. Как вы измеряете «cost of reasoning» у агента (не только токены, но и шаги, время, ошибки)
- 400. Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения на шум и без катастрофиче...
- 404. Что такое circuit breaker и как он применяется к LLM API вызовам
- 407. Как вы проектируете dead letter queue для failed LLM инференс запросов
- 410. Как вы делаете blue-green deployment для RAG системы с zero downtime
- 414. Как вы проектируете multi-region active-active для LLM API
- 505. Как вы проверяете, что новая версия модели не сломала старые кейсы