Поиск
- wikiАсинхронная индексация
# Асинхронная индексация ## Определение Предварительная индексация документов в фоновом режиме, не блокирующая основные операции RAG-системы. ## Где встречается - [[800+ вопросов|800…
- wikihot/warm индексы
# hot/warm индексы ## Определение Архитектура с двумя индексами: «горячий» для часто обновляемых данных и «теплый» для редко обновляемых, что позволяет…
- wikiMulti-vector index
# Multi-vector index ## Определение Архитектура индексации, где эмбеддинги разных модальностей (аудио, видео) хранятся в отдельных индексах с меткой модальности. Позволяет…
- wikiиндексы
…Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]
- wikipayload-индексы
# payload-индексы ## Определение Индексы на полях payload в векторной БД (например, Qdrant) для ускорения фильтрации по метаданным. Позволяют быстро выполнять…
- wikiRAG indexing
# RAG indexing ## Определение Индексация для RAG (RAG indexing) — этап преобразования документов в поисковый индекс, включающий чанкинг, эмбеддинг и сохранение метаданных…
- wikihot/warm strategy
# hot/warm strategy ## Определение Паттерн обновления индексов, где маленький горячий индекс обслуживает real-time запросы, а большой тёплый индекс используется…
- wikiwarm index
# warm index ## Определение Большой индекс, перестраиваемый по расписанию, обеспечивающий высокую точность поиска за счёт периодического обновления. ## Где встречается - [[231. Как…
- wikireindex
# reindex ## Определение Полное перестроение ANN-индекса для восстановления точности; дорогая операция, которая планируется по расписанию или при падении recall. ## Где…
- wikiУникальный индекс
# Уникальный индекс ## Определение Индекс БД, запрещающий дублирование записей; в векторных хранилищах предотвращает повторную вставку одних и тех же векторов, поддерживая…
- wikiscene detection
# scene detection ## Определение Разбивка видео на логические сегменты (шоты) для последующей индексации, часто с использованием гистограмм или PySceneDetect. ## Где встречается…
- wikiFFmpeg
…Как вы индексируете видео-контент в RAG-системе]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…
- wikihot index
# hot index ## Определение Маленький быстрый индекс для обработки запросов в реальном времени, используемый в паттерне hot/warm для баланса скорости…
- wikibuilding index
# building index ## Определение Новый индекс, который наполняется эмбеддингами от новой модели, пока старый обслуживает запросы. Используется для бесшовной замены embedding…
- wikiTransNetV2
# TransNetV2 ## Определение Нейросеть для сегментации видео на сцены, используемая для индексации видеоконтента в RAG-системах. ## Где встречается - [[546. Как вы…
- wikiHierarchical Indexing
…Как вы индексируете видео-контент в RAG-системе]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…
- wikiMinHashLSH
# MinHashLSH ## Определение Индекс на основе MinHash для быстрого поиска near-дубликатов в больших коллекциях документов. Используется для дедупликации в RAG…
- wikiNear-duplicate
# Near-duplicate ## Определение Тексты с незначительными отличиями, которые требуется удалять при дедупликации документов перед индексацией в RAG. ## Где встречается - [[257…
- wikiStreaming deduplication
# Streaming deduplication ## Определение Инкрементальное обновление индекса дедупликации в реальном времени для исключения дубликатов при загрузке данных. ## Где встречается - [[257. Как…
- wikitemporal bounding
# temporal bounding ## Определение Сохранение временных меток для каждого чанка или кадра при индексации видео, чтобы при поиске возвращать точный таймкод…
- wikiDual index
# Dual index ## Определение Стратегия параллельного использования двух индексов (старого и нового) для бесшовного обновления embedding модели без даунтайма. Старый индекс…
- wikiUnified retrieval
# Unified retrieval ## Определение Подход к поиску, при котором все модальности (текст, изображения) индексируются в одной векторной базе, упрощая архитектуру, но…
- wikiyt-dlp
…Как вы индексируете видео-контент в RAG-системе]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…
- wikiключевой кадр
# ключевой кадр ## Определение Один или несколько репрезентативных кадров из видео, используемых для индексации визуального содержания в RAG-системах. ## Где встречается…
- wikiBit signature
…Как вы дедуплицируете документы перед индексацией в RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…
- wikiincremental insert
# incremental insert ## Определение Добавление новых векторов в ANN-индекс без полного перестроения. Ускоряет обновление, но может снижать точность поиска. ## Где…
- wikigraph imbalance
…Как вы обновляете ANN индекс при добавлении новых векторов без перестроения]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiMetadata index
# Metadata index ## Определение Индекс, создаваемый на часто фильтруемых полях метаданных, для ускорения операций фильтрации в векторных БД. ## Где встречается - [[800…
- wikivideo indexing
# video indexing ## Определение Процесс извлечения и индексации информации из видео для последующего поиска в RAG-системах. ## Где встречается - [[800+ вопросов…
- wikiTwo-phase indexing
# Two-phase indexing ## Определение Two-phase indexing — подход к индексации, при котором документ сначала проходит все фильтры и проверки, а…
- wikiIndexFlatL2
# IndexFlatL2 ## Определение Точный (brute force) индекс FAISS для поиска по L2 расстоянию. Используется как baseline в бенчмарках и для получения…
- wikiPySceneDetect
…Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]
- wikiSeparate indices
# Separate indices ## Определение Стратегия мультимодального поиска, при которой для текстовых и визуальных данных создаются отдельные индексы, а результаты объединяются через…
- wikiFusion reranking
# Fusion reranking ## Определение Метод объединения и переранжирования результатов из разных индексов для улучшения качества мультимодального поиска. ## Где встречается - [[555. Как…
- wikimoment retrieval
…Как вы индексируете видео-контент в RAG-системе]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…
- wikiExact duplicate
…Как вы дедуплицируете документы перед индексацией в RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…
- wikiShingle
…Как вы дедуплицируете документы перед индексацией в RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…
- wikiSemantic duplicate
…Как вы дедуплицируете документы перед индексацией в RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…
- wikiHamming distance
…Как вы дедуплицируете документы перед индексацией в RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…
- wikiWebP
…Как вы индексируете видео-контент в RAG-системе]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…
- wikiWhisper
# Whisper ## Определение Используется для транскрибации аудиодорожки в текст в пайплайне индексации видео. ## Где встречается - [[116. Как вы индексируете видео-контент…
- wikiExact hashing
…Как вы дедуплицируете документы перед индексацией в RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…
- wikiPost-ingestion checks
# Post-ingestion checks ## Определение Периодические проверки всего корпуса на деградацию качества после индексации данных. ## Где встречается - [[275. Как вы делаете…
- wikiBridgeTower
…Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]
- wikiANN индекс
# ANN индекс ## Определение Структура данных для быстрого приближённого поиска ближайших векторов; качество измеряется через recall@k. ## Где встречается - [[9. Как…
- wikiGIST1M
…Как вы измеряем recall@k для ANN индекса и какой порог acceptable]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс…
- wikihash index
# hash index ## Определение Тип индекса в базе данных для полей с точным совпадением, например, doc_type или author_id. ## Где…
- wikiVisual Embedding
…Как вы индексируете видео-контент в RAG-системе]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…
- wikiRandom projections
…Как вы дедуплицируете документы перед индексацией в RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…
- wikiquery set
…Как вы измеряем recall@k для ANN индекса и какой порог acceptable]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс…