Knowledge Portal

aivaro.ru

  • Оглавление
  • Вопросы
  • Практика
  • Вики
  • Тесты
  • Поиск
✈Telegram @AetSeidhe
RUEN中文
…
Оглавление/Вики/gold documents

gold documents

gold documents

Определение

Набор эталонных документов для каждого запроса в тестовом наборе, используемый для вычисления метрик retrieval (precision, recall).

Где встречается

  • Практика
  • 800+ вопросов

Навигация

  • Индекс терминов
  • Индекс разборов
  • Оглавление

Теги

wikiтерминdataevaluationretrieval

Обратные ссылки (21)

  • Индекс терминов
  • Как вы fine-tune embedding модель под свой домен (а не используете готовую)?
  • Как вы генерируете hard negative примеры для retrieval обучения?
  • Как вы делаете hybrid search (vector + keyword) в production на 10M документов?
  • Как вы измеряете drift retrieval-качества в RAG (когда документы меняются)?
  • Как вы измеряете recall@k для ANN индекса и какой порог acceptable?
  • Как вы калибруете retrieval confidence для threshold-based filtering?
  • Как вы оцениваете retrieval с учетом позиции (Position-aware metrics)?
  • Как вы оцениваете качество retrieval'а в RAG-системе?
  • Как вы проектируете language representation для сложной задачи?
  • Как вы фильтруете документы по метаданным в векторной БД?
  • Как работает adversarial example для embedding моделей (атака на retrieval)?
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: RAG с мультиязычным поиском (русский/английский/китайский)
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить cross-encoder reranking
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить retrieval quality dashboard
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать hard negative mining для retrieval
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Спроектировать partial failure UI
  • Что такое Hypothetical Document Embeddings (HyDE) и зачем?
  • Что такое adversarial retrieval (атака на retrieval компонент RAG)?
  • Что такое semantic ranking на основе embeddings (вторая стадия после ANN)?
  • Что такое synthetic data collapse (когда синтетические данные деградируют со временем)?