English translation is not available yet. Showing Russian content.
VALSE benchmark
VALSE benchmark
Определение
Бенчмарк, тестирующий способность vision-language моделей обрабатывать лингвистические явления, такие как предлоги, множественные числа, отрицания.