RAG
RAG
Определение
Архитектура, дополняющая генерацию LLM поиском релевантных документов. Пайплайн состоит из ингреста, чанкинга, эмбеддинга, индексации, ретривала, переранжирования и генерации. Позволяет модели отвечать по актуальным источникам, снижая галлюцинации и повышая точность.
Где встречается
- 38. Как вы fine-tune модель для функции вызов внешнего API
- 44. CrewAI vs AutoGen vs LangGraph — сравнение
- 71. Как вы тестируете RAG-систему на новых документах без реальных пользователей
- 74. Как вы мониторите дрейф данных (data drift) для RAG
- 133. Альтернативы LLM-as-Judge — назовите 3 и их ограничения.
- 134. Как вы оцениваете faithfulness RAG-ответа в production автоматически
- 375. Как вы калибруете retrieval confidence для threshold-based filtering
- 517. Как вы проектируете feature store для ML фичей, используемых LLM
- 520. Как вы проектируете data lineage для RAG (от документа к ответу)
- 651. Как работает attention математически Выведите формулу scaled dot-product attention.
- 732. Что такое EU AI Act и как оно влияет на деплой LLM в production
- 738. Назовите 12+ слоёв эталонной архитектуры Harness.
- Практика
- 800+ вопросов
- 21. Интегрировать OpenTelemetry в RAG
- 30. Настроить correlation между метриками
- 85. Спроектировать escalation system
- 87. Спроектировать partial failure UI
- 88. Реализовать hallucination indicator
- 90. Реализовать user trust метрику
- 91. Написать postmortem для retrieval degradation
- 97. Настроить retrieval quality dashboard
- 154. Протестировать multi-turn диалоги
- 157. Интегрировать тестирование в CICD
- 195. Реализовать blue-green deployment для RAG
- 197. Реализовать graceful degradation при отказе vector DB
- 225. Semantic cache для RAG
- 236. RAG с оценкой faithfulness
- 247. RAG с distributed tracing
- 249. RAG с cost-aware routing
- 254. Реализовать SLO для RAG
- 255. Настроить correlation метрик
- 265. Создать blameless postmortem template
- 269. Реализовать hard negative mining для retrieval
- 276. Настроить RAGAS evaluation pipeline
- 279. Настроить adversarial evaluation для RAG
- 281. Настроить мониторинг дрейфа метрик
- 296. RAG с векторной БД на CPU (ChromaQdrant)
- 299. RAG с мультиязычным поиском (русскийанглийскийкитайский)
- 300. Полная платформа для оценки RAG