English translation is not available yet. Showing Russian content.
COCO
COCO
Определение
Крупный датасет с аннотированными изображениями, содержащий bounding boxes и текстовые описания объектов; применяется для обучения и оценки моделей компьютерного зрения, grounding и мультимодальных систем.
Где встречается
- 547. Как вы оцениваете мультимодальную модель на галлюцинации (POPE, MMHal-Bench)
- 564. Как работает модели типа Kosmos-2 (grounding объектов на изображении)
- 800+ вопросов