中文翻译暂不可用,显示俄语原文。
ViViT
ViViT
Определение
Архитектура для обработки видео, использующая факторизованный энкодер: сначала пространственное внимание внутри кадров, затем временное между кадрами.
中文翻译暂不可用,显示俄语原文。
Архитектура для обработки видео, использующая факторизованный энкодер: сначала пространственное внимание внутри кадров, затем временное между кадрами.