top-k

Определение

Параметр, задающий число извлекаемых документов или токенов при поиске. Выбор k наиболее релевантных документов для вписывания в контекстное окно.

Где встречается

14. Как вы обрезаете контекст, когда retrieved documents больше контекстного окна LLM
16. Как вы оцениваете качество генерации в RAG. Назовите 3 ключевые метрики.
17. Как вы уменьшаете галлюцинации в RAG
132. Как вы калибруете LLM-судью под человеческие оценки
215. Что такое Wave Decoding и чем отличается от стандартного авторегрессивного
372. Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG
378. Как работает многогранный (faceted) поиск в RAG с фильтрами
408. Как вы делаете distributed tracing для цепочки user → gateway → RAG → LLM → user
416. Как вы делаете load shedding при перегрузке LLM сервера
800+ вопросов
91. Написать postmortem для retrieval degradation
97. Настроить retrieval quality dashboard
105. Настроить Memory (in-memory + vector)
110. Реализовать quality gates для агента
139. Настроить cost attribution per feature
225. Semantic cache для RAG
239. Multi-tenant RAG с изоляцией
249. RAG с cost-aware routing
255. Настроить correlation метрик
275. Реализовать active learning loop
296. RAG с векторной БД на CPU (ChromaQdrant)
300. Полная платформа для оценки RAG

top-k

top-k

Определение

Где встречается

Навигация