English translation is not available yet. Showing Russian content.
VLM
VLM
Определение
Мультимодальная модель, объединяющая обработку визуальной и текстовой информации; применяется для задач captioning, VQA и оценки галлюцинаций.
Где встречается
- 368. Как вы оцениваете мультимодальную модель на hallucinations (POPE, MMHal-Bench)
- 547. Как вы оцениваете мультимодальную модель на галлюцинации (POPE, MMHal-Bench)
- 555. Как работает мультимодальный RAG с unified retrieval (один индекс для текста и изображений)
- 558. Как вы делаете video summarization для RAG (вход — длинное видео, выход — краткое описание)
- 800+ вопросов