Поиск
- wikiBridgeTower
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiмультимодальный RAG
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiALBEF
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiSeparate indices
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiUnified embedding space
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiFusion reranking
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiCaption-based approach
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiUnified retrieval
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiopen_clip
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- answerЧем мультимодальный RAG отличается от «OCR + текстовый RAG»? Почему второго недостаточно?
…Чем мультимодальный RAG отличается от «OCR + текстовый RAG»? Почему второго недостаточно? ## Краткий тезис [[Вики/мультимодальный RAG\|Мультимодальный RAG]] ([[Вики/мультимодальный…
- wikiBLIP
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiVLM
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiGPT-4V
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiTop-k routing
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiLLaVA
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikicross-encoder
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikicontrastive loss
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiметаданные
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiInverted File Index
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiCLIP
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiHNSW
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- answerКак работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)?
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)? ## Краткий тезис [[Вики/Unified retrieval\|Unified retrieval…
- answerКак быть, если одно и то же изображение встречается в документах с разными подписями?
…мультимодальный RAG, изображение, подпись, контекст - [[Вики/мультимодальный RAG\|Мультимодальный RAG]] — [[Вики/Expansion\|расширение]] классического [[Вики/гибридный поиск\|RAG]], где в…
- wikiHit rate
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikiвекторная БД
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- wikireranking
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)|555. Как работает мультимодальный RAG с unified…
- answerКак вы проектируете multimodal RAG для диаграмм (flowchart, architecture diagram)?
…Как вы проектируете multimodal RAG для диаграмм (flowchart, architecture diagram)? ## Краткий тезис [[Вики/мультимодальный RAG\|Multimodal RAG]] для диаграмм — это…
- answerКак вы комбинируете текстовый и визуальный поиск (early fusion vs late fusion)?
…Термины и контекст - [[Вики/мультимодальный RAG\|Мультимодальный RAG]] — [[Вики/Expansion\|расширение]] классического [[Вики/гибридный поиск\|RAG]], где в качестве источников…
- answerКак работает модели типа Kosmos-2 (grounding объектов на изображении)?
…локализует вывеску, затем OCR-модуль читает текст. - [[Вики/мультимодальный RAG\|Мультимодальный RAG]] изображение разбивается на [[Вики/Regions\|регионы]], каждый [[Вики…
- answerКак вы проверяете, что LLM правильно «понял» диаграмму, а не просто угадал?
…SRR обязателен, иначе [[Вики/GPT-4o\|LLM]] может «угадать» по части. - [[Вики/мультимодальный RAG\|Мультимодальный RAG]] с изображениями: SRR помогает…
- answerКак вы делаете extraction таблиц из PDF для RAG?
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)\|555]] | Как вы интегрируете OCR в RAG…
- answerКак вы извлекаете *логические отношения* из диаграммы, а не просто текст?
…Чем мультимодальный RAG отличается от «OCR + текстовый RAG» Почему второго недостаточно\|111]] | Извлечение текста из изображений (OCR) | | [[113. Как вы…
- answerКак вы делаете image captioning для RAG (извлечение описания изображения)?
…Как работает OCR для RAG Недостатки и когда его недостаточно\|550]] | Как построить мультимодальный RAG (текст + изображения)? | | [[551. Как работает…
- answerЧто такое Layout-Aware Chunking и как он связан с мультимодальностью?
…Чем мультимодальный RAG отличается от «OCR + текстовый RAG» Почему второго недостаточно\|111]] | Что такое мультимодальный RAG | | [[115. Как вы обрабатываете…
- answerКак вы делаете retrieval для изображений с защитой авторских прав (watermarking)?
…с другими вопросами | Вопрос | Тема | |--------|------| | [[560\|560]] | Как построить мультимодальный RAG (текст + изображения)? | | [[561\|561]] | Какие стратегии предобработки изображений для…
- answerКакое будущее у DSPy? Вытеснит ли он LangChain в 2026-2027?
…Чем мультимодальный RAG отличается от «OCR + текстовый RAG» Почему второго недостаточно\|111]] - Индекс: [[00. Индекс разборов]]
- answerКак работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)?
…Что такое adversarial fine-tuning для защиты от jailbreak\|360]] | Мультимодальный RAG: как интегрировать изображения в RAG-пайплайн | | [[361. Как…
- answerКак работает Zero-shot classification для изображений (CLIP vs другие методы)?
…Как вы фильтруете документы по метаданным в векторной БД\|12]] | Мультимодальный RAG | | [[20. Как вы обеспечиваете, что RAG работает с…
- answerКак работает OCR для RAG? Недостатки и когда его недостаточно?
…Связь с другими вопросами | Вопрос | Тема | |--------|------| | [[549\|549]] | Как обрабатывать PDF-документы в RAG? | | [[551\|551]] | Что такое мультимодальный RAG…
- answerКак вы делаете RAG для видео (индексация subshots, аудио, ключевые кадры)?
…Как вы проектируете систему для real-time video understanding (поток с камер)\|370]] | Что такое мультимодальный RAG? | | [[371. Что такое…
- answerЧто такое LayoutLMv3 и зачем он для document understanding?
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)\|555]] | Table Transformer: детекция таблиц | | [[560. Как…
- answerКак работает AudioLM и MusicGen для генерации аудио?
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)\|555]] | Как оценивать качество сгенерированного аудио? | --- ## Навигация…
- answerКак работает CLIP и как training contrastive loss выравнивает текст и изображения?
…Что такое Fuyu-8B и чем архитектурно отличается от GPT-4V\|362]] | Как устроен мультимодальный RAG (текст + изображения)? | | [[365. Как…
- answerЧто такое Audio RAG (RAG для аудиофайлов)?
…Что такое Hypothetical Document Embeddings (HyDE) и зачем\|11]] | Мультимодальный RAG (текст+изображения) | | [[18. Что такое Multi-vector retrieval и…
- answerКак работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)?
…Как работает Q-Former в BLIP-2 и зачем он нужен\|540]] | Как работает мультимодальный RAG? | | [[541. Как вы делаете…
- answerКак работает whisper.cpp для локального ASR с low latency?
…Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)\|555]] | Как вы уменьшаете latency RAG-системы…
- answerКак вы делаете RAG для изображений (image retrieval without text)?
…clip.load("ViT-L/14") # ... пересчёт и сортировка ``` --- ## 7. Мультимодальный RAG: объединение текста и изображений Часто требуется RAG-система, которая…
- answerКак работает CLIP (Contrastive Language-Image Pre-training) внутренне?
…Интегрировать CLIP в простой мультимодальный RAG: создать векторную БД из изображений (например, Unsplash dataset), реализовать поиск по текстовому запросу и…
- answerКак вы делаете image retrieval с фильтрацией по метаданным (дата, местоположение, камера)?
…Почему агенты деградируют на длинных horizon (более 10 шагов)\|566]] | Мультимодальный RAG (текст + изображения) | | [[568. Как работает Toolformer-like обучение…
- answerЧто такое Q-Former в BLIP-2 и зачем он нужен?
…Как работает мультимодальное выравнивание (alignment) в моделях типа Chameleon (Meta)\|365]] | Что такое мультимодальный RAG и как он работает? | | [[366…