Поиск
- wikiBridgeTower
# BridgeTower ## Определение Мультимодальный эмбеддер, объединяющий визуальные и текстовые представления для unified retrieval в RAG. ## Где встречается - [[555. Как работает мультимодальный…
- wikiALBEF
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiмультимодальный RAG
# мультимодальный RAG ## Определение Архитектура RAG, объединяющая текстовые и визуальные эмбеддинги для поиска и генерации ответов по данным разных типов (текст…
- wikiCaption-based approach
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiSeparate indices
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiUnified embedding space
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiFusion reranking
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- answerЧем мультимодальный RAG отличается от «OCR + текстовый RAG»? Почему второго недостаточно?
…Чем мультимодальный RAG отличается от «OCR + текстовый RAG»? Почему второго недостаточно? ## Краткий тезис [[Вики/мультимодальный RAG\|Мультимодальный RAG]] ([[Вики/мультимодальный…
- wikiUnified retrieval
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiopen_clip
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikimultimodal embedding
…Как вы делаете RAG для изображений (image retrieval without text)|541. Как вы делаете RAG для изображений (image retrieval without…
- wikiBLIP
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiVLM
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiGPT-4V
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiTop-k routing
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiLLaVA
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikicross-encoder
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikicontrastive loss
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiметаданные
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- answerКакие embedding-модели для мультимодального поиска вы используете? CLIP, BLIP-2, ImageBind?
…Что такое Self-RAG и когда его использовать\|10]] | Self‑RAG — может ли модель сама решить, когда использовать мультимодальный поиск…
- answerКак вы комбинируете текстовый и визуальный поиск (early fusion vs late fusion)?
…Термины и контекст - [[Вики/мультимодальный RAG\|Мультимодальный RAG]] — [[Вики/Expansion\|расширение]] классического [[Вики/гибридный поиск\|RAG]], где в качестве источников…
- wikiCLIP
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiHNSW
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiInverted File Index
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- answerКак вы делаете RAG для видео (индексация subshots, аудио, ключевые кадры)?
…Как вы проектируете систему для real-time video understanding (поток с камер)\|370]] | Что такое мультимодальный RAG? | | [[371. Что такое…
- answerКак работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)?
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)? ## Краткий тезис [[Вики/Unified retrieval\|Unified retrieval…
- wikiHit rate
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiвекторная БД
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- answerКак быть, если одно и то же изображение встречается в документах с разными подписями?
…мультимодальный RAG, изображение, подпись, контекст - [[Вики/мультимодальный RAG\|Мультимодальный RAG]] — [[Вики/Expansion\|расширение]] классического [[Вики/гибридный поиск\|RAG]], где в…
- answerКак вы проверяете, что LLM правильно «понял» диаграмму, а не просто угадал?
…SRR обязателен, иначе [[Вики/GPT-4o\|LLM]] может «угадать» по части. - [[Вики/мультимодальный RAG\|Мультимодальный RAG]] с изображениями: SRR помогает…
- wikireranking
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- answerКак вы проектируете multimodal RAG для диаграмм (flowchart, architecture diagram)?
…Как вы проектируете multimodal RAG для диаграмм (flowchart, architecture diagram)? ## Краткий тезис [[Вики/мультимодальный RAG\|Multimodal RAG]] для диаграмм — это…
- answerЧто такое Layout-Aware Chunking и как он связан с мультимодальностью?
…Чем мультимодальный RAG отличается от «OCR + текстовый RAG» Почему второго недостаточно\|111]] | Что такое мультимодальный RAG | | [[115. Как вы обрабатываете…
- answerКак вы делаете RAG для изображений (image retrieval without text)?
…Мультимодальный RAG: объединение текста и изображений Часто требуется RAG-система, которая работает и с текстовыми документами, и с изображениями. Возможны…
- answerКак работает CLIP и как training contrastive loss выравнивает текст и изображения?
…Выбираем класс с максимальным косинусным сходством. [[Вики/multimodal retrieval\|Мультимодальный поиск]] (например, в RAG-системе): - Пользовательский запрос (текст) кодируется Text…
- answerКак вы делаете retrieval для изображений с защитой авторских прав (watermarking)?
…мультимодальный RAG (текст + изображения)? | | [[561\|561]] | Какие стратегии предобработки изображений для RAG? | | [[562\|562]] | Как обеспечить безопасность контента в RAG…
- answerКак работает Zero-shot classification для изображений (CLIP vs другие методы)?
…Применение в контексте Agentic RAG В [[Вики/Agentic RAG\|Agentic RAG]] CLIP может выступать как мультимодальный модуль для: - Классификации входных…
- answerКак работает модели типа Kosmos-2 (grounding объектов на изображении)?
…локализует вывеску, затем OCR-модуль читает текст. - [[Вики/мультимодальный RAG\|Мультимодальный RAG]] изображение разбивается на [[Вики/Regions\|регионы]], каждый [[Вики…
- answerКак вы делаете image retrieval с фильтрацией по метаданным (дата, местоположение, камера)?
…Почему агенты деградируют на длинных horizon (более 10 шагов)\|566]] | Мультимодальный RAG (текст + изображения) | | [[568. Как работает Toolformer-like обучение…
- answerЧто такое LayoutLMv3 и зачем он для document understanding?
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)\|555]] | Table Transformer: детекция таблиц | | [[560. Как…
- answerКак бы вы спроектировали RAG-систему для 10 000 документов с разной структурой (PDF, Word, сканы, HTML, Excel)?
…LangChain vs LlamaIndex vs Haystack — что выберете и почему\|41]] | LangChain vs LlamaIndex vs Haystack | | 111-120 | Мультимодальный RAG (изображения…
- answerКак вы делаете image captioning для RAG (извлечение описания изображения)?
…Как работает OCR для RAG Недостатки и когда его недостаточно\|550]] | Как построить мультимодальный RAG (текст + изображения)? | | [[551. Как работает…
- answerКак вы делаете extraction таблиц из PDF для RAG?
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)\|555]] | Как вы интегрируете OCR в RAG…
- answerКак вы извлекаете *логические отношения* из диаграммы, а не просто текст?
…Чем мультимодальный RAG отличается от «OCR + текстовый RAG» Почему второго недостаточно\|111]] | Извлечение текста из изображений (OCR) | | [[113. Как вы…
- answerКак работает vision encoder в GPT-4V / LLaVA?
…Роль vision encoder в Agentic RAG (мультимодальный retrieval) В [[Вики/Agentic RAG\|Agentic RAG]] агент может получать изображения от пользователя…
- answerЧто такое Audio RAG (RAG для аудиофайлов)?
…Что такое Hypothetical Document Embeddings (HyDE) и зачем\|11]] | Мультимодальный RAG (текст+изображения) | | [[18. Что такое Multi-vector retrieval и…
- answerКакое будущее у DSPy? Вытеснит ли он LangChain в 2026-2027?
…Чем мультимодальный RAG отличается от «OCR + текстовый RAG» Почему второго недостаточно\|111]] - Индекс: [[00. Индекс разборов]]
- answerКак работает OCR для RAG? Недостатки и когда его недостаточно?
…Связь с другими вопросами | Вопрос | Тема | |--------|------| | [[549\|549]] | Как обрабатывать PDF-документы в RAG? | | [[551\|551]] | Что такое мультимодальный RAG…
- answerКак работает whisper.cpp для локального ASR с low latency?
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)\|555]] | Как вы уменьшаете latency RAG-системы…
- answerВ чем проблема «natural language bottleneck» для LLM?
…statsmodels` через инструмент (Agentic RAG), ошибка снижается до уровня ARIMA. [[Вики/Expansion\|Расширение]]: Добавить мультимодальный канал — передать график ряда (изображение…