multimodal LLM
multimodal LLM
Определение
Большая языковая модель, способная принимать на вход и обрабатывать данные разных типов: текст, изображения, аудио. Преодолевает ограничение natural language bottleneck.
Где встречается
- 181. В чем проблема «natural language bottleneck» для LLM
- 362. Что такое Fuyu-8B и чем архитектурно отличается от GPT-4V