fallback model
fallback model
Определение
Резервная модель или стратегия (например, общая LLM без RAG) при отсутствии ответа от основной модели или документов, обеспечивающая graceful degradation.
Где встречается
- 8. Как вы обрабатываете запросы, на которые нет ответа в документах
- 43. Как спроектировать агента, который может выполнять цепочку из 5-10 действий
- 50. Как вы ограничиваете бесконечный цикл агента
- 56. Как вы делаете агента отказоустойчивым (graceful degradation)
- 60. Как вы обрабатываете ошибки агента (action не сработал, API вернул ошибку)
- 65. Как вы обрабатываете rate limiting от LLM провайдеров (OpenAI, Anthropic)
- 75. Что такое structured output constrained decoding и зачем это нужно
- 76. Как вы делаете AB тестирование двух моделей в production
- 79. Как вы обновляете embedding модель без полной переиндексации
- 81. Как бы вы спроектировали систему для 1000 одновременных пользователей чат-бота с RAG
- 85. Как вы обрабатываете смену форматов документов (legacy + новые форматы)
- 89. Как вы спроектируете систему, которая может переключаться между разными LLM провайдерами без даунтайма
- 94. Как вы проектируете промпты, которые работают с разными моделями
- 109. Как вы бенчмарките DSPy против ручного промпт-инжиниринга в production
- 140. Как вы проверяете, что новая версия модели не сломала старые кейсы
- 142. Как вы проектируете «планировщика» (planner) для Agentic RAG
- 143. Как вы боретесь с «бесконечным циклом» агента в Agentic RAG
- 156. Как вы выбираете между увеличением тест-тайм компьютинга и использованием большей модели
- 174. Что такое «многошаговая когерентность» (coherence illusion) в cascading agent systems
- 237. Что такое circuit breaker и как он применяется к LLM API вызовам
- 238. Как вы реализуете retry с exponential backoff для LLM API с rate limit
- 240. Как вы проектируете dead letter queue для failed LLM инференс запросов
- 243. Как вы делаете blue-green deployment для RAG системы с zero downtime
- 247. Как вы проектируете multi-region active-active для LLM API
- 254. Как вы проектируете disaster recovery для LLM системы при сбое региона
- 272. Как вы проверяете качество parsing документов (PDF, DOCX) в production
- 359. Как вы защищаете multi-agent систему от вредоносного агента
- 382. Как вы проектируете canary deployment для LLM модели
- 383. Что такое error budget для AI качества и как его считать
- 384. Как вы проводим chaos engineering для RAG системы
- 385. Как вы автоматизируете rollback при деградации качества
- 389. Как вы делаем disaster recovery с RPO 1 минута
- 391. Как вы проектируете агента, который может работать непрерывно (247) без дрейфа поведения
- 393. Как вы измеряете «cost of reasoning» у агента (не только токены, но и шаги, время, ошибки)
- 400. Как вы проектируете систему для continuous learning LLM-агента в production — чтобы агент улучшался от взаимодействий с пользователями без переобучения на шум и без катастрофиче...
- 404. Что такое circuit breaker и как он применяется к LLM API вызовам
- 407. Как вы проектируете dead letter queue для failed LLM инференс запросов
- 410. Как вы делаете blue-green deployment для RAG системы с zero downtime
- 414. Как вы проектируете multi-region active-active для LLM API
- 505. Как вы проверяете, что новая версия модели не сломала старые кейсы