English translation is not available yet. Showing Russian content.
Image patches as tokens
Image patches as tokens
Определение
Техника, при которой изображение разбивается на патчи, которые напрямую подаются как входные токены в языковую модель, минуя отдельный визионный энкодер. Используется в архитектуре Fuyu-8B.