CogVLM
CogVLM
Определение
CogVLM — мультимодальная модель с глубокой интеграцией визуальных и языковых признаков через экспертные модули, применяемая для задач captioning и video summarization.
Где встречается
- 362. Что такое Fuyu-8B и чем архитектурно отличается от GPT-4V
- 558. Как вы делаете video summarization для RAG (вход — длинное видео, выход — краткое описание)