CogVLM

Определение

CogVLM — мультимодальная модель с глубокой интеграцией визуальных и языковых признаков через экспертные модули, применяемая для задач captioning и video summarization.

Где встречается

362. Что такое Fuyu-8B и чем архитектурно отличается от GPT-4V
558. Как вы делаете video summarization для RAG (вход — длинное видео, выход — краткое описание)

CogVLM

CogVLM

Определение

Где встречается

Навигация