Knowledge Portal

aivaro.ru

  • Оглавление
  • Вопросы
  • Практика
  • Вики
  • Тесты
  • Поиск
✈Telegram @AetSeidhe
RUEN中文
…
Оглавление/Вики/topk

topk

topk

Определение

Параметр, задающий количество лучших результатов, возвращаемых поиском (например, k=10), или функция PromQL для выбора top-N значений.

Где встречается

  • 42. Настроить hybrid search с весами
  • 132. Настроить cost tracking в production

Навигация

  • Индекс терминов
  • Индекс разборов
  • Оглавление

Теги

wikiтерминmlopsretrieval

Ссылки

  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить cost tracking в production
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить hybrid search с весами и оптимизировать w

Обратные ссылки (80)

  • EAGLE-3 vs Medusa-2 vs Hydra: сравнение speculative decoding методов?
  • ScaNN (Google) vs HNSW — сравнение для больших масштабов (>100M векторов)?
  • Индекс терминов
  • Как бы вы спроектировали RAG-систему для 10 000 документов с разной структурой (PDF, Word, сканы, HTML, Excel)?
  • Как быть, если одно и то же изображение встречается в документах с разными подписями?
  • Как вы выбираете ANN алгоритм под ваш use case (volume, dimensionality, budget)?
  • Как вы генерируете hard negative примеры для retrieval обучения?
  • Как вы делаете RAG для изображений (image retrieval without text)?
  • Как вы делаете distributed tracing для цепочки: user → gateway → RAG → LLM → user?
  • Как вы делаете image retrieval по тексту с высокой точностью?
  • Как вы делаете load shedding при перегрузке LLM сервера?
  • Как вы делаете long context для code generation (модель должна видеть весь репозиторий)?
  • Как вы делаете query rewriting и query expansion в RAG?
  • Как вы защищаете LLM от градиентных атак (white-box jailbreak)?
  • Как вы измеряете recall@k для ANN индекса и какой порог acceptable?
  • Как вы индексируете видео-контент в RAG-системе?
  • Как вы комбинируете текстовый и визуальный поиск (early fusion vs late fusion)?
  • Как вы мониторите дрейф данных (data drift) для RAG?
  • Как вы обновляете ANN индекс при добавлении новых векторов без перестроения?
  • Как вы обрезаете контекст, когда retrieved documents > контекстного окна LLM?
  • Как вы оцениваете качество language representation для задачи?
  • Как вы оцениваете качество retrieval'а в RAG-системе?
  • Как вы оцениваете качество генерации в RAG? Назовите 3 ключевые метрики.
  • Как вы проектируете data lineage для RAG (от документа к ответу)?
  • Как вы проектируете feature engineering для контекста RAG (кроме текста)?
  • Как вы строите двухступенчатый ретривал (fast ANN + slow cross-encoder) в RAG?
  • Как вы уменьшаете latency RAG-системы (время ответа)?
  • Как вы уменьшаете галлюцинации в RAG?
  • Как вы фильтруете документы по метаданным в векторной БД?
  • Как делать adversarial evals для RAG (проверка на устойчивость)?
  • Как детектировать и предотвращать vector DB poisoning?
  • Как работает DiskANN и когда он нужен?
  • Как работает HNSW (Hierarchical Navigable Small World) алгоритм внутренне?
  • Как работает Mixture of Experts (MoE) внутри LLM (спарсинг активации)?
  • Как работает MoE (Mixture of Experts) внутри LLM (Mixtral, GPT-4)?
  • Как работает adversarial example для embedding моделей (атака на retrieval)?
  • Как работает greedy decoding vs beam search vs sampling?
  • Как работает membership inference атака на LLM?
  • Как работает алгоритм ReST (Reinforced Self-Training) и когда он лучше PPO?
  • Как работает многогранный (faceted) поиск в RAG с фильтрами?
  • Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)?
  • Какие оптимизаторы (teleprompters) в DSPy вы использовали и когда? BootstrapFewShot, MIPRO, COPRO?
  • Почему MoE (Mixture of Experts) быстрее dense модели при инференсе?
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Multi-tenant RAG с изоляцией данных
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: RAG с векторной БД на CPU (Chroma/Qdrant)
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Агент с памятью через векторную БД
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Интегрировать OpenTelemetry в RAG
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Написать postmortem для retrieval degradation
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Написать runbook для retrieval degradation
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить Memory (in-memory + vector)
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить correlation метрик (граф зависимостей retrieval → generation latency)
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить cost attribution per feature
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить cross-encoder reranking
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить hybrid search с весами и оптимизировать w
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить recurrent memory для long context
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить retrieval quality dashboard
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать active learning loop
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать component registry
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать graceful degradation при отказе vector DB
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать quality gates для агента
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать verifier-guided decoding
  • ЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)
  • Что вы сделаете в первую неделю на новой работе Senior AI Engineer?
  • Что такое Audio RAG (RAG для аудиофайлов)?
  • Что такое Hierarchical Navigable Small World + IVF (HNSW+IVF) гибрид?
  • Что такое LambdaMART и как он используется для reranking в RAG?
  • Что такое Learned Index Structures for ANN? Новые подходы 2025-2026?
  • Что такое Top-p (nucleus) sampling и как он сочетается с temperature?
  • Что такое Wave Decoding и чем отличается от стандартного авторегрессивного?
  • Что такое Wave Decoding и чем отличается от стандартного авторегрессивного?
  • Что такое active learning для сбора синтетических данных?
  • Что такое expert parallelism для MoE моделей (Mixtral)?
  • Что такое hierarchical retrieval для long context RAG (когда контекст > 100k)?
  • Что такое hybrid search с весами (weighted hybrid) и как оптимизировать веса?
  • Что такое learning-to-rank (LTR) и как он применяется к retrieval для LLM?
  • Что такое logits и как они связаны с вероятностями? temperature scaling?
  • Что такое repetition penalty и как он работает?
  • Что такое selective attention в контексте long context обработки?
  • Что такое semantic ranking на основе embeddings (вторая стадия после ANN)?
  • Что такое «аутсорсинг» задачи другому LLM (с другим API, другой ценой)?