Image-Text Matching
Image-Text Matching
Определение
Бинарная классификация, определяющая, соответствует ли текст данному изображению. Применяется как обучающая задача Q-Former на первом этапе.
Где встречается
- 367. Что такое Q-Former в BLIP-2 и зачем он нужен
- 540. Как работает Q-Former в BLIP-2 и зачем он нужен