中文翻译暂不可用,显示俄语原文。
ViT-L/14
ViT-L/14
Определение
Конкретная версия Vision Transformer с размером патча 14x14 пикселей. Применяется как vision encoder в GPT-4V и Fuyu-8B.
中文翻译暂不可用,显示俄语原文。
Конкретная версия Vision Transformer с размером патча 14x14 пикселей. Применяется как vision encoder в GPT-4V и Fuyu-8B.