ALIGN
ALIGN
Определение
Мультимодальная модель от Google, обученная на 1.8B пар изображение-текст с асимметричным contrastive loss, альтернатива CLIP.
Где встречается
- 117. Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind
- 361. Как работает CLIP и как training contrastive loss выравнивает текст и изображения