Поиск

  • answerЧто такое гибридный поиск и когда он нужен?

    …Что такое гибридный поиск и когда он нужен? ## Краткий тезис поиск|Гибридный поиск — это комбинация векторного (семантического) поиска и ключевого…

  • wikifaceted search

    # faceted search ## Определение Техника фильтрации результатов поиска по нескольким атрибутам (фасетам). Позволяет комбинировать фильтры для уточнения результатов, часто применяется в…

  • wikimultimodal retrieval

    # multimodal retrieval ## Определение Процесс поиска релевантных документов в одной модальности по запросу в другой (например, поиск изображений по тексту). Использует…

  • wikiобратный поиск

    # обратный поиск ## Определение Метод ранжирования изображений, при котором запрос преобразуется в CLIP-эмбеддинг, после чего выполняется ANN-поиск по индексу…

  • wikiSynonymizer

    # Synonymizer ## Определение Компонент поисковых систем, расширяющий запрос синонимами для улучшения релевантности результатов гибридного поиска. ## Где встречается - [[6. Что такое гибридный…

  • answerКак работает многогранный (faceted) поиск в RAG с фильтрами?

    …Pre-filtering (фильтрация до векторного поиска) **Pre-filter** — сначала применяются фильтры по метаданным, затем поиск|векторный поиск выполняется только в…

  • wikiMultilingual Retrieval

    # Multilingual Retrieval ## Определение Поиск документов на разных языках (русском, английском, китайском) из единого корпуса. Позволяет находить релевантную информацию независимо от…

  • wikiвекторный поиск

    # векторный поиск ## Определение Метод поиска релевантных документов на основе семантической близости их векторных представлений (эмбеддингов), а не точного совпадения ключевых…

  • wikiIVFFlat

    # IVFFlat ## Определение Тип индекса FAISS для приближённого поиска ближайших соседей на основе L2 расстояния. Используется для быстрого поиска по эмбеддингам…

  • wikijieba

    # jieba ## Определение Токенизатор для китайского и других языков, часто используемый в системах поиска и RAG-пайплайнах. ## Где встречается - [[227. RAG…

  • wikiгибридный retrieval

    # гибридный retrieval ## Определение Метод поиска, объединяющий векторный поиск (по эмбеддингам) и keyword-поиск (например, BM25) для повышения полноты и точности…

  • wikiWikipedia abstracts

    # Wikipedia abstracts ## Определение Краткие изложения статей Википедии, используемые в качестве корпуса документов для задач поиска и генерации ответов. ## Где встречается…

  • wikik1

    …Влияет на то, как частота слова влияет на релевантность при гибридном поиске. ## Где встречается - [[227. RAG с гибридным поиском|227…

  • wikiPrecision@5

    # Precision@5 ## Определение Метрика точности для top-5 результатов поиска или ранжирования. Показывает долю релевантных документов среди первых пяти выданных…

  • wikitext-to-image retrieval

    # text-to-image retrieval ## Определение Задача поиска изображений, наиболее релевантных текстовому запросу пользователя. Реализуется с помощью визуального индекса и моделей…

  • wikirequirements.txt

    …RAG с гибридным поиском|227. RAG с гибридным поиском]] - [[239. Multi-tenant RAG с изоляцией|239. Multi-tenant RAG с…

  • wikiInstruction prefix

    # Instruction prefix ## Определение Префикс для поискового запроса, например 'Represent this sentence for searching relevant passages:' для модели BGE-M3. ## Где…

  • wikiвесовой коэффициент

    # весовой коэффициент ## Определение Параметр, используемый в комбинированных методах поиска (например, RRF) для задания относительной важности различных источников (dense vs sparse…

  • wikiIndexIDMap

    # IndexIDMap ## Определение Структура FAISS для привязки произвольных идентификаторов к векторам, позволяющая выполнять pre-filtering по ID перед поиском. ## Где встречается…

  • wikiintfloat/multilingual-e5-small

    # intfloat/multilingual-e5-small ## Определение Компактная версия мультиязычной эмбеддинг-модели с размерностью векторов 384, используемая для гибридного поиска в RAG…

  • wikiключевой поиск

    # ключевой поиск ## Определение Метод поиска на основе точного совпадения терминов, часто реализуемый через BM25; эффективен для редких терминов и применяется…

  • wikidynamic facets

    # dynamic facets ## Определение Фасеты (аспекты поиска), которые вычисляются на лету на основе запроса пользователя для уточнения фильтрации результатов. ## Где встречается…

  • wikifacet

    # facet ## Определение Атрибут или категория, по которой можно отфильтровать данные в многогранном поиске. Например, дата, автор, тема — каждый фасет позволяет…

  • answerКак вы фильтруете документы по метаданным в векторной БД?

    …Post-filtering (сначала поиск, потом фильтр) Что это Сначала выполняем [[Вики/векторный поиск\|векторный поиск]] по всей БД, находим [[Вики…

  • answerКакую векторную БД вы выберете для production-системы с >1 млн векторов?

    …HNSW, IVF, PQ | | Сложность поиска: O(log n) | Сложность поиска: O(log n) для ANN, но приближённо | | Хранит строки, числа…

  • wikiAdaptive Retrieval

    # Adaptive Retrieval ## Определение Стратегия, при которой система поиска переформулирует запрос или выполняет дополнительные поиски, если уверенность в релевантности результатов ниже…

  • answerКак работает HNSW (Hierarchical Navigable Small World) алгоритм внутренне?

    …Приближённый поиск ближайших соседей (ANN) **Приближённый [[Вики/retrieval\|поиск]] ближайших соседей ([[Вики/ANN индекс\|Approximate Nearest Neighbor]], [[Вики/ANN индекс…

  • wikiRRF

    …Что такое гибридный поиск и когда он нужен|6. Что такое гибридный поиск и когда он нужен]] - [[8. Как вы…

  • wikiBoolean Filters

    # Boolean Filters ## Определение Фильтрация документов по точным значениям метаданных (дата, источник) в поисковых системах. Применяется в гибридном поиске для сужения…

  • wikiLaBSE

    …RAG с мультиязычным поиском (русскийанглийскийкитайский)|299. RAG с мультиязычным поиском (русскийанглийскийкитайский)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • answerВ чем разница между Naive RAG, Adaptive RAG и Agentic RAG?

    поиск, калькулятор, API, код | | [[Вики/Memory\|Память]] | Нет | Нет | Есть (история шагов) | | [[Вики/TTFT\|Latency]] | Высокая (всегда поиск) | Низкая для…

  • wikiroofline model

    # roofline model ## Определение Модель анализа вычислительной интенсивности и пропускной способности памяти для поиска узких мест в производительности. ## Где встречается - [[310…

  • wikiadversarial retrieval

    # adversarial retrieval ## Определение Атака на компонент поиска (retrieval) в RAG-системе, при которой создаются документы с высоким сходством, чтобы они…

  • wikistop words

    …RAG с гибридным поиском|227. RAG с гибридным поиском]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • answerЧто такое hybrid search с весами (weighted hybrid) и как оптимизировать веса?

    …В контексте [[Вики/гибридный поиск\|RAG]] чаще всего объединяют: - **поиск|Векторный поиск (dense retrieval)** — поиск по эмбеддингам, измеряющий семантическую близость…

  • wikiopen_clip

    # open_clip ## Определение Открытая реализация модели CLIP, доступная через библиотеку open_clip, поддерживает различные варианты моделей для мультимодального поиска. ## Где…

  • wikiLexical gap

    # Lexical gap ## Определение Проблема несовпадения терминов запроса и релевантного документа при лексическом поиске (например, BM25), когда один и тот же…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: RAG с гибридным поиском (Qdrant + BM25 + RRF)

    …Критерии приемки (Definition of Done) - [ ] Реализован dense-поиск на Qdrant (загрузка чанков, поиск по cosine). - [ ] Реализован BM25-поиск (индекс, поиск

  • wikiindexing

    # indexing ## Определение Процесс построения индекса в векторной БД для эффективного поиска. Включает загрузку, обработку и подготовку данных, часто с удалением…

  • wikiearly fusion

    # early fusion ## Определение Стратегия комбинирования текстового и визуального поиска путем создания единого мультимодального эмбеддинга на этапе индексации. ## Где встречается - [[119…

  • wikiL2 Normalization

    # L2 Normalization ## Определение Нормализация эмбеддингов для улучшения качества косинусного поиска или использования индексов типа IndexFlatIP. ## Где встречается - [[546. Как вы…

  • answerКак вы комбинируете текстовый и визуальный поиск (early fusion vs late fusion)?

    …Как вы комбинируете текстовый и визуальный поиск (early fusion vs late fusion)? ## Краткий тезис Комбинирование текстового и визуального поиска в…

  • wikiSearch engineering

    # Search engineering ## Определение Область, на которую опирается качественный RAG, включающая ранжирование и поиск. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация…

  • wikiImageBind

    …Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind|117. Какие embedding-модели для мультимодального поиска вы…

  • wikiElasticsearch

    # Elasticsearch ## Определение Поисковая система на основе BM25, используется для полнотекстового и гибридного поиска (векторный + ключевой), часто применяется в RAG. ## Где…

  • wikilecture search

    # lecture search ## Определение Поиск фрагментов аудиолекций на основе Audio RAG, позволяющий извлекать релевантные аудиоотрывки по текстовому запросу. ## Где встречается - [[800…

  • wikiretrieval miss

    # retrieval miss ## Определение Ситуация, когда релевантные документы не найдены в процессе поиска — типичная проблема RAG-систем. ## Где встречается - [[800+ вопросов…

  • wikivector score

    # vector score ## Определение Оценка релевантности на основе плотного поиска по эмбеддингам, используемая в гибридном поиске вместе с текстовыми весами. ## Где…

  • wikiWikipedia API

    …RAG с гибридным поиском|227. RAG с гибридным поиском]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • wikiAlphaSearch

    # AlphaSearch ## Определение AlphaSearch — метод инференса, комбинирующий MCTS с верификатором для итеративного поиска лучшего ответа. Используется для улучшения качества генерации за…