Поиск
- answerЧто такое гибридный поиск и когда он нужен?
…поиск|Векторный поиск находит документы по смыслу, но может пропустить точные термины (ID, номера заказов, коды). поиск|Ключевой поиск находит…
- wikiвекторный индекс
# векторный индекс ## Определение Структура данных (например, HNSW, IVF), обеспечивающая быстрый поиск ближайших соседей среди векторных эмбеддингов; используется для эффективного семантического…
- answerКак работает многогранный (faceted) поиск в RAG с фильтрами?
…Post-filtering (фильтрация после векторного поиска) **[[Вики/Post-filter\|Post-filter]]** — сначала выполняется [[Вики/векторный поиск\|векторный поиск]] по всей…
- wikiвекторный поиск
# векторный поиск ## Определение Метод поиска релевантных документов на основе семантической близости их векторных представлений (эмбеддингов), а не точного совпадения ключевых…
- wikiгибридный retrieval
# гибридный retrieval ## Определение Метод поиска, объединяющий векторный поиск (по эмбеддингам) и keyword-поиск (например, BM25) для повышения полноты и точности…
- answerКак вы фильтруете документы по метаданным в векторной БД?
…Post-filtering (сначала поиск, потом фильтр) Что это Сначала выполняем [[Вики/векторный поиск\|векторный поиск]] по всей БД, находим [[Вики…
- wikiVespa
# Vespa ## Определение Платформа для поиска и рекомендаций, поддерживающая гибридный поиск (векторный + лексический) и LTR. ## Где встречается - [[233. Как вы делаете…
- wikiScore normalization
# Score normalization ## Определение Процесс приведения оценок релевантности из разных поисковых методов (векторный, лексический) к единому диапазону (например, [0,1]) для…
- wikiRedis Stack
# Redis Stack ## Определение Модульная версия Redis с поддержкой векторного поиска (Search + векторный индекс), используемая для семантического кэша и распределённого кэширования…
- wikiGraphRAG
…Комбинирует векторный поиск с графовым анализом для улучшения качества RAG. ## Где встречается - [[196. Как language representation связан с тест-тайм…
- answerЧто такое hybrid search с весами (weighted hybrid) и как оптимизировать веса?
…В контексте [[Вики/гибридный поиск\|RAG]] чаще всего объединяют: - **поиск|Векторный поиск (dense retrieval)** — поиск по эмбеддингам, измеряющий семантическую близость…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить hybrid search с весами и оптимизировать w
…Цель задачи Разработать и протестировать [[Вики/гибридный поиск\|гибридный поиск]], комбинирующий векторный косинусный [[Вики/retrieval\|поиск]] и [[Вики/reranking\|ранжирование…
- answerКак вы делаете hybrid search (vector + keyword) в production на 10M документов?
…Hybrid Search (гибридный поиск) **[[Вики/гибридный поиск\|Hybrid search]]** — это техника, при которой поисковая система одновременно выполняет [[Вики/векторный поиск…
- answerКак вы делаете image captioning для RAG (извлечение описания изображения)?
…caption индексируется как обычный текст, [[Вики/retrieval\|поиск]] по ключевым словам. - [[Вики/векторный поиск\|Векторный поиск]]: caption эмбеддируется (например, через…
- answerВ чем разница между Naive RAG, Adaptive RAG и Agentic RAG?
…tool selection learning\|Выбор инструментов]] | Только векторный поиск | Только векторный поиск | Несколько: поиск, калькулятор, API, код | | [[Вики/Memory\|Память]] | Нет…
- answerЧто такое Hypothetical Document Embeddings (HyDE) и зачем?
…врачи задавали короткие [[Вики/Query\|запросы]] вроде «диабет 2 типа лечение». [[Вики/векторный поиск\|Векторный поиск]] находил общие статьи, но…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: RAG с гибридным поиском (Qdrant + BM25 + RRF)
…Текущий [[Вики/baseline\|baseline]] — только [[Вики/векторный поиск\|векторный поиск]]. Цель — увеличить полноту поиска ([[Вики/Recall@k\|Recall@10]]) минимум…
- wikiElasticsearch
# Elasticsearch ## Определение Поисковая система на основе BM25, используется для полнотекстового и гибридного поиска (векторный + ключевой), часто применяется в RAG. ## Где…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать RRF (Reciprocal Rank Fusion)
…Цель задачи Научиться объединять несколько ранжированных списков документов из разных источников ([[Вики/векторный поиск\|векторный поиск]], [[Вики/BM25\|BM25]], [[Вики…
- answerКак проектировать graceful degradation при отказе vector DB?
…сначала на поиск по кэшу, затем на ответы LLM без внешнего контекста с предупреждением пользователя, и, наконец, на запасной векторный…
- answerКак вы делаете disaster recovery с RPO <1 минута?
…Вики/Query\|запросы]]. - [[Вики/векторный индекс\|Векторный индекс]] ([[Вики/Qdrant\|vector index]]) — структура для быстрого поиска по эмбеддингам документов. - [[Вики…
- answerКак бы вы спроектировали RAG-систему для 10 000 документов с разной структурой (PDF, Word, сканы, HTML, Excel)?
…Retrieval стратегия (гибридный поиск) Почему не достаточно только векторного поиска - [[Вики/векторный поиск\|Векторный поиск]] находит по смыслу, но может…
- wikiBM25
…Часто применяется в гибридном поиске (векторный + ключевой) и как baseline в retrieval. ## Где встречается - [[1. Как бы вы спроектировали RAG…
- answerЧто такое learning-to-rank (LTR) и как он применяется к retrieval для LLM?
…Быстрый поиск (retrieval|first-stage retrieval) — BM25, поиск|векторный поиск, гибридный. Возвращает top-k (например, 100–500 чанков). 2. [[Вики…
- answerКакие есть стратегии распределённого кэширования для LLM (Redis Cluster, Memcached, Hazelcast)?
…Однако [[Вики/Semantic Caching\|семантическое кэширование]] ([[Вики/векторный поиск\|поиск по векторам]]) требует отдельного индекса (не встроен). **Пример конфигурации кластера…
- answerКак вы делаете retrieval для структурированных данных (SQL, Knowledge Graph)?
…Зачем нужен отдельный подход - поиск|Векторный поиск по сериализованным таблицам (например, «превратить строку таблицы в текст») теряет структуру и связи…
- answerКак вы делаете image retrieval с фильтрацией по метаданным (дата, местоположение, камера)?
…Как вы проектируете multimodal RAG для диаграмм (flowchart, architecture diagram)\|561]] | Гибридный поиск (векторный + keyword) | | [[562. Как работает whisper.cpp…
- answerКакую векторную БД вы выберете для production-системы с >1 млн векторов?
…Термин «Pre-filter vs Post-filter» - Pre-filter сначала отфильтровать по метаданным (только документы за 2025), потом векторный поиск. Точнее…
- answerКак учитывать CAP theorem в AI systems?
…Например, если векторный поиск недоступен – агент идёт в реляционную БД, пусть и с менее релевантными документами. --- ## 6. Как выбирать CP…
- answerКак устроена Memory в Harness (in-memory, fs, vector stores, relay)?
…3. **Если требуется [[Вики/векторный поиск\|семантический поиск]] → [[Вики/Chroma\|vector store]]**: выполняем [[Вики/ANN\|ANN-поиск]], возможно, с фильтром…
- answerКак вы обновляете embedding модель без полной переиндексации?
…Поэтому подставить новые [[Вики/embedding\|эмбеддинги]] в старый **[[Вики/qdrant-client\|векторный индекс]]** (структуру данных для быстрого поиска ближайших соседей…
- answerЧто такое Semantic Caching и как вы его реализуете?
…Вместо сравнения строк (exact match) используется сравнение эмбеддингов запроса через **поиск|векторный поиск**. Если новый запрос попадает в окрестность уже…
- answerКак делать feature engineering для RAG (кроме текста)?
…на датасете научных запросов по сравнению с чистым [[Вики/векторный поиск\|dense retrieval]]. ## 7. Практические рекомендации 1. Собирай [[Вики/метаданные…
- answerЧто такое data version control (DVC) для RAG корпуса документов?
…2. [[Вики/векторный индекс\|Векторный индекс]] — результат обработки корпуса ([[Вики/embedding\|эмбеддинги]], структура поиска). Почему это важно: - При изменении корпуса…
- answerЧто такое Audio RAG (RAG для аудиофайлов)?
…английского | | pyannote-audio | Speaker diarization | | [[Вики/Faiss\|FAISS]] (facebookresearch) | Векторный поиск | | [[Вики/LangChain\|LangChain]] | Оркестрация RAG-пайплайна | | [[Вики/LlamaIndex\|LlamaIndex…
- wikiQdrant
…поддерживает фильтрацию, гибридный поиск, gRPC, multi-tenancy и pre-filtering. Широко используется для хранения и поиска эмбеддингов в RAG-системах…
- answerКак изменилась роль инженера с приходом Harness Engineering?
…документов | | Инструменты | Внешние функции, которые агент может вызывать | Векторный поиск, веб-поиск, калькулятор, SQL-запрос | | [[Вики/boundaries\|Границы]] | Ограничения на…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: RAG с cross-encoder reranking
…Технологический стек | Компонент | Инструменты | Назначение | |-----------|-------------|-------------| | Язык | Python 3.10+ | Весь код | | Векторный поиск | FAISS (faiss-cpu) | Построение индекса и ANN…
- answerЧто такое Filtered ANN Search и как оно реализовано в Qdrant vs Weaviate?
…Это увеличивает [[Вики/Latency\|latency]]. - [[Вики/Qdrant\|Weaviate]] поддерживает [[Вики/гибридный поиск\|hybrid search]] (векторный + keyword), где [[Вики/фильтр\|фильтр…
- answerКак работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)?
…Векторный индекс — структура данных (например, HNSW, IVF) для быстрого поиска ближайших соседей. В retrieval|unified retrieval один индекс содержит векторы…
- answerЧто такое Learned Index Structures for ANN? Новые подходы 2025-2026?
…Вместо того чтобы хранить иерархию кластеров или графов, [[Вики/model\|модель]] учится отображать векторный [[Вики/Key\|ключ]] непосредственно в предсказанную…
- answerЧто такое IVF (Inverted File Index) и как он сравнивается с HNSW по speed/quality?
…Как работает Product Quantization (PQ) для сжатия векторов\|223]] | Гибридный поиск (векторный + keyword) | --- ## 12. Навигация (Obsidian) - Предыдущий: [[221\|221]] - Следующий…
- answerКак вы защищаете RAG-систему от утечки данных между клиентами (multi-tenant isolation)?
…При каждом поиске tenant_id пользователя подставляется как обязательный фильтр (pre-filter) в поиск|векторный поиск. Дополнительно нужна изоляция на…
- answerКак вы индексируете видео-контент в RAG-системе?
…текстовое описание в полнотекстовом индексе (Elasticsearch) — это даст гибридный поиск (векторный + BM25). --- ## Пет-проект для закрепления [[Вики/Task\|Задача]] Создайте…
- answerКак вы делаете query rewriting и query expansion в RAG?
…Обе техники повышают **[[Вики/accuracy\|recall]]** (полноту поиска) и качество [[Вики/retrieval\|retrieval]], особенно для коротких, разговорных или нечётких запросов…
- answerЧто такое Memory-optimized ANN и какие алгоритмы лучшие для ограниченной RAM (<16GB)?
…Как вы проектируете RAG для 10k RPS с P99 latency 200ms Архитектура.\|236]] | Гибридный поиск (векторный + BM25) в условиях ограниченной…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Агент с памятью через векторную БД
…Главная [[Вики/Task\|задача]] — не просто хранить историю чата, а реализовать [[Вики/векторный поиск\|семантический поиск]] для релевантного контекста, чтобы…
- answerLangChain vs LlamaIndex vs Haystack — что выберете и почему?
…Ожидаемый результат Работающее приложение, которое для фактологических вопросов использует векторный поиск, для вопросов типа «перечислить» — keyword search, а для свежих…
- answerКак вы обрабатываете большие таблицы в RAG (500+ строк)?
…Сколько заработал менеджер Иванов за последний квартал?» (вытягивая строки). - Векторный поиск по строкам находит именно строки с Ивановым, а не…
- answerКак работает OCR для RAG? Недостатки и когда его недостаточно?
…В контексте [[Вики/гибридный поиск\|RAG]] [[Вики/Tesseract OCR\|OCR]] служит первым этапом пайплайна индексации для документов, которые не имеют…