中文翻译暂不可用,显示俄语原文。
Masked Visual Modeling (MVM)
Masked Visual Modeling (MVM)
Определение
Masked Visual Modeling (MVM) — метод предобучения моделей компьютерного зрения, при котором 15% визуальных патчей изображения маскируются (зашумляются). Модель обучается предсказывать исходное визуальное содержимое замаскированных областей, что позволяет ей понимать структуру и семантику изображений. MVM является аналогом Masked Language Modeling (MLM) из NLP, но для визуальных данных.