Поиск

  • wikiАсинхронная индексация

    # Асинхронная индексация ## Определение Предварительная индексация документов в фоновом режиме, не блокирующая основные операции RAG-системы. ## Где встречается - [[800+ вопросов|800…

  • wikihot/warm индексы

    # hot/warm индексы ## Определение Архитектура с двумя индексами: «горячий» для часто обновляемых данных и «теплый» для редко обновляемых, что позволяет…

  • wikiMulti-vector index

    # Multi-vector index ## Определение Архитектура индексации, где эмбеддинги разных модальностей (аудио, видео) хранятся в отдельных индексах с меткой модальности. Позволяет…

  • wikiиндексы

    Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]

  • wikipayload-индексы

    # payload-индексы ## Определение Индексы на полях payload в векторной БД (например, Qdrant) для ускорения фильтрации по метаданным. Позволяют быстро выполнять…

  • wikiRAG indexing

    # RAG indexing ## Определение Индексация для RAG (RAG indexing) — этап преобразования документов в поисковый индекс, включающий чанкинг, эмбеддинг и сохранение метаданных…

  • wikihot/warm strategy

    # hot/warm strategy ## Определение Паттерн обновления индексов, где маленький горячий индекс обслуживает real-time запросы, а большой тёплый индекс используется…

  • wikiwarm index

    # warm index ## Определение Большой индекс, перестраиваемый по расписанию, обеспечивающий высокую точность поиска за счёт периодического обновления. ## Где встречается - [[231. Как…

  • wikireindex

    # reindex ## Определение Полное перестроение ANN-индекса для восстановления точности; дорогая операция, которая планируется по расписанию или при падении recall. ## Где…

  • wikiУникальный индекс

    # Уникальный индекс ## Определение Индекс БД, запрещающий дублирование записей; в векторных хранилищах предотвращает повторную вставку одних и тех же векторов, поддерживая…

  • wikiscene detection

    # scene detection ## Определение Разбивка видео на логические сегменты (шоты) для последующей индексации, часто с использованием гистограмм или PySceneDetect. ## Где встречается…

  • wikiFFmpeg

    …Как вы индексируете видео-контент в RAG-системе]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…

  • wikihot index

    # hot index ## Определение Маленький быстрый индекс для обработки запросов в реальном времени, используемый в паттерне hot/warm для баланса скорости…

  • wikibuilding index

    # building index ## Определение Новый индекс, который наполняется эмбеддингами от новой модели, пока старый обслуживает запросы. Используется для бесшовной замены embedding…

  • wikiTransNetV2

    # TransNetV2 ## Определение Нейросеть для сегментации видео на сцены, используемая для индексации видеоконтента в RAG-системах. ## Где встречается - [[546. Как вы…

  • wikiHierarchical Indexing

    …Как вы индексируете видео-контент в RAG-системе]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…

  • wikiMinHashLSH

    # MinHashLSH ## Определение Индекс на основе MinHash для быстрого поиска near-дубликатов в больших коллекциях документов. Используется для дедупликации в RAG…

  • wikiNear-duplicate

    # Near-duplicate ## Определение Тексты с незначительными отличиями, которые требуется удалять при дедупликации документов перед индексацией в RAG. ## Где встречается - [[257…

  • wikiStreaming deduplication

    # Streaming deduplication ## Определение Инкрементальное обновление индекса дедупликации в реальном времени для исключения дубликатов при загрузке данных. ## Где встречается - [[257. Как…

  • wikitemporal bounding

    # temporal bounding ## Определение Сохранение временных меток для каждого чанка или кадра при индексации видео, чтобы при поиске возвращать точный таймкод…

  • wikiDual index

    # Dual index ## Определение Стратегия параллельного использования двух индексов (старого и нового) для бесшовного обновления embedding модели без даунтайма. Старый индекс

  • wikiUnified retrieval

    # Unified retrieval ## Определение Подход к поиску, при котором все модальности (текст, изображения) индексируются в одной векторной базе, упрощая архитектуру, но…

  • wikiyt-dlp

    …Как вы индексируете видео-контент в RAG-системе]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…

  • wikiключевой кадр

    # ключевой кадр ## Определение Один или несколько репрезентативных кадров из видео, используемых для индексации визуального содержания в RAG-системах. ## Где встречается…

  • wikiBit signature

    …Как вы дедуплицируете документы перед индексацией в RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…

  • wikiincremental insert

    # incremental insert ## Определение Добавление новых векторов в ANN-индекс без полного перестроения. Ускоряет обновление, но может снижать точность поиска. ## Где…

  • wikigraph imbalance

    …Как вы обновляете ANN индекс при добавлении новых векторов без перестроения]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiMetadata index

    # Metadata index ## Определение Индекс, создаваемый на часто фильтруемых полях метаданных, для ускорения операций фильтрации в векторных БД. ## Где встречается - [[800…

  • wikivideo indexing

    # video indexing ## Определение Процесс извлечения и индексации информации из видео для последующего поиска в RAG-системах. ## Где встречается - [[800+ вопросов…

  • wikiTwo-phase indexing

    # Two-phase indexing ## Определение Two-phase indexing — подход к индексации, при котором документ сначала проходит все фильтры и проверки, а…

  • wikiIndexFlatL2

    # IndexFlatL2 ## Определение Точный (brute force) индекс FAISS для поиска по L2 расстоянию. Используется как baseline в бенчмарках и для получения…

  • wikiPySceneDetect

    Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]

  • wikiSeparate indices

    # Separate indices ## Определение Стратегия мультимодального поиска, при которой для текстовых и визуальных данных создаются отдельные индексы, а результаты объединяются через…

  • wikiFusion reranking

    # Fusion reranking ## Определение Метод объединения и переранжирования результатов из разных индексов для улучшения качества мультимодального поиска. ## Где встречается - [[555. Как…

  • wikimoment retrieval

    …Как вы индексируете видео-контент в RAG-системе]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…

  • wikiExact duplicate

    …Как вы дедуплицируете документы перед индексацией в RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…

  • wikiShingle

    …Как вы дедуплицируете документы перед индексацией в RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…

  • wikiSemantic duplicate

    …Как вы дедуплицируете документы перед индексацией в RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…

  • wikiHamming distance

    …Как вы дедуплицируете документы перед индексацией в RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…

  • wikiWebP

    …Как вы индексируете видео-контент в RAG-системе]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…

  • wikiWhisper

    # Whisper ## Определение Используется для транскрибации аудиодорожки в текст в пайплайне индексации видео. ## Где встречается - [[116. Как вы индексируете видео-контент…

  • wikiExact hashing

    …Как вы дедуплицируете документы перед индексацией в RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…

  • wikiPost-ingestion checks

    # Post-ingestion checks ## Определение Периодические проверки всего корпуса на деградацию качества после индексации данных. ## Где встречается - [[275. Как вы делаете…

  • wikiBridgeTower

    Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]

  • wikiANN индекс

    # ANN индекс ## Определение Структура данных для быстрого приближённого поиска ближайших векторов; качество измеряется через recall@k. ## Где встречается - [[9. Как…

  • wikiGIST1M

    …Как вы измеряем recall@k для ANN индекса и какой порог acceptable]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс

  • wikihash index

    # hash index ## Определение Тип индекса в базе данных для полей с точным совпадением, например, doc_type или author_id. ## Где…

  • wikiVisual Embedding

    …Как вы индексируете видео-контент в RAG-системе]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…

  • wikiRandom projections

    …Как вы дедуплицируете документы перед индексацией в RAG]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление…

  • wikiquery set

    …Как вы измеряем recall@k для ANN индекса и какой порог acceptable]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс