Image-grounded Text Generation
Image-grounded Text Generation
Определение
Задача генерации текста на основе изображения, например автоматическое описание (captioning). Является одной из обучающих задач Q-Former на первом этапе.
Где встречается
- 367. Что такое Q-Former в BLIP-2 и зачем он нужен
- 540. Как работает Q-Former в BLIP-2 и зачем он нужен