Поиск
- wikiVQA
# VQA ## Определение Задача ответа на вопросы по изображению, BLIP-2 достигает высоких результатов ## Где встречается - [[117. Какие embedding-модели для…
- wikiQ-Former
# Q-Former ## Определение Модуль-мост между frozen vision encoder и frozen LLM в архитектуре BLIP-2. Использует learnable query tokens…
- wikiBLIP-2
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikiCIDEr
…Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind]] - [[367. Что такое Q-Former в BLIP-2…
- wikiImage-Text Matching
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikiImage-grounded Text Generation
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikiImage-Text Contrastive
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikiQuery Tokens
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikiFlamingo
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikiimage captioning
…Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind]] - [[540. Как работает Q-Former в BLIP-2…
- wikiAdapter layers
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikiFlanT5
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikiOPT
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikiFLAVA
…Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind|117. Какие embedding-модели для мультимодального поиска вы…
- wikiFlickr8k
…Как работает Q-Former в BLIP-2 и зачем он нужен|540. Как работает Q-Former в BLIP-2 и…
- wikifrozen
…Как работает Q-Former в BLIP-2 и зачем он нужен|540. Как работает Q-Former в BLIP-2 и…
- wikiimagebind_llm
…Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind|117. Какие embedding-модели для мультимодального поиска вы…
- wikiMiniGPT-4
…Как работает Q-Former в BLIP-2 и зачем он нужен|540. Как работает Q-Former в BLIP-2 и…
- wikiViLT
…Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind|117. Какие embedding-модели для мультимодального поиска вы…
- wikiViT
…Используется в качестве vision encoder в моделях GPT-4V, BLIP-2, LayoutLMv3 и других. ## Где встречается - [[116. Как вы индексируете…
- wikiResNet
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikihyperparameters
…Как работает Q-Former в BLIP-2 и зачем он нужен|540. Как работает Q-Former в BLIP-2 и…
- wikiALIGN
…Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind|117. Какие embedding-модели для мультимодального поиска вы…
- wikiopen_clip
…Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind|117. Какие embedding-модели для мультимодального поиска вы…
- wikimultimodal retrieval
…Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind|117. Какие embedding-модели для мультимодального поиска вы…
- wikiмультимодальный RAG
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikiDecoder
…Как работает Q-Former в BLIP-2 и зачем он нужен|540. Как работает Q-Former в BLIP-2 и…
- wikiImageBind
…Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind|117. Какие embedding-модели для мультимодального поиска вы…
- wikiProjection into LLM space
…Как работает Q-Former в BLIP-2 и зачем он нужен|540. Как работает Q-Former в BLIP-2 и…
- answerКак работает Q-Former в BLIP-2 и зачем он нужен?
…Обучение Q-Former (три этапа в BLIP-2) [[Вики/BLIP-2\|BLIP-2]] обучает [[Вики/Q-Former\|Q-Former]] в…
- answerКак вы делаете image captioning для RAG (извлечение описания изображения)?
…для [[Вики/production\|production]] используйте [[Вики/BLIP-2\|BLIP-2]] ([[Вики/trade-off\|баланс]] скорость/качество) или [[Вики/LLaVA\|LLaVA…
- wikiCross-attention
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikigated cross-attention
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikiVision encoder
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikiPrefix-tuning
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikiLinear layer
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikirecall@1
…Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind|117. Какие embedding-модели для мультимодального поиска вы…
- answerКакие embedding-модели для мультимодального поиска вы используете? CLIP, BLIP-2, ImageBind?
…BLIP-2 ### Архитектура и обучение [[Вики/BLIP-2\|BLIP‑2]] (Salesforce) — улучшение подхода [[Вики/BLIP\|BLIP]], добавляющее [[Вики/Q-Former…
- answerЧто такое Q-Former в BLIP-2 и зачем он нужен?
…Q-Former и его место в BLIP-2 [[Вики/BLIP-2\|BLIP-2]] — это [[Вики/VLM\|мультимодальная модель]], предназначенная для…
- wikiBottleneck
…Как работает Q-Former в BLIP-2 и зачем он нужен|540. Как работает Q-Former в BLIP-2 и…
- wikiLoRA
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- answerКак вы делаете video summarization для RAG (вход — длинное видео, выход — краткое описание)?
…Можно использовать [[Вики/batch size\|batch processing]] или более лёгкие модели (например, [[Вики/BLIP-2\|BLIP-2]] [[Вики/Base frequency…
- wikiLLaVA
…Как работает Q-Former в BLIP-2 и зачем он нужен|540. Как работает Q-Former в BLIP-2 и…
- wikiBLEU
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikiZero-shot
…Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind|117. Какие embedding-модели для мультимодального поиска вы…
- wikicatastrophic forgetting
…Как работает Q-Former в BLIP-2 и зачем он нужен|540. Как работает Q-Former в BLIP-2 и…
- wikiHugging Face
…Как работает Q-Former в BLIP-2 и зачем он нужен|540. Как работает Q-Former в BLIP-2 и…
- wikiAttention
…Что такое Q-Former в BLIP-2 и зачем он нужен|367. Что такое Q-Former в BLIP-2 и…
- wikicontrastive loss
…Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind|117. Какие embedding-модели для мультимодального поиска вы…
- wikiTesseract OCR
…Как работает Q-Former в BLIP-2 и зачем он нужен|540. Как работает Q-Former в BLIP-2 и…