top-k
top-k
Определение
Параметр, задающий число извлекаемых документов или токенов при поиске. Выбор k наиболее релевантных документов для вписывания в контекстное окно.
Где встречается
- 14. Как вы обрезаете контекст, когда retrieved documents больше контекстного окна LLM
- 16. Как вы оцениваете качество генерации в RAG. Назовите 3 ключевые метрики.
- 17. Как вы уменьшаете галлюцинации в RAG
- 132. Как вы калибруете LLM-судью под человеческие оценки
- 215. Что такое Wave Decoding и чем отличается от стандартного авторегрессивного
- 372. Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG
- 378. Как работает многогранный (faceted) поиск в RAG с фильтрами
- 408. Как вы делаете distributed tracing для цепочки user → gateway → RAG → LLM → user
- 416. Как вы делаете load shedding при перегрузке LLM сервера
- 800+ вопросов
- 91. Написать postmortem для retrieval degradation
- 97. Настроить retrieval quality dashboard
- 105. Настроить Memory (in-memory + vector)
- 110. Реализовать quality gates для агента
- 139. Настроить cost attribution per feature
- 225. Semantic cache для RAG
- 239. Multi-tenant RAG с изоляцией
- 249. RAG с cost-aware routing
- 255. Настроить correlation метрик
- 275. Реализовать active learning loop
- 296. RAG с векторной БД на CPU (ChromaQdrant)
- 300. Полная платформа для оценки RAG