English translation is not available yet. Showing Russian content.

Image patches as tokens

Image patches as tokens

Определение

Техника, при которой изображение разбивается на патчи, которые напрямую подаются как входные токены в языковую модель, минуя отдельный визионный энкодер. Используется в архитектуре Fuyu-8B.

Где встречается

Навигация