English translation is not available yet. Showing Russian content.

ViT

ViT

Определение

Архитектура нейронной сети на основе Transformer для обработки изображений. Используется в качестве vision encoder в моделях GPT-4V, BLIP-2, LayoutLMv3 и других.

Где встречается

Навигация