Mixtral
Mixtral
Определение
Mixtral — семейство моделей архитектуры Mixture of Experts (MoE) от Mistral AI, активирующих только часть параметров на каждом токене, что сочетает высокое качество с эффективностью.
Где встречается
- 368. Как вы оцениваете мультимодальную модель на hallucinations (POPE, MMHal-Bench)
- 435. Почему MoE (Mixture of Experts) быстрее dense модели при инференсе
- 680. Как работает Mixture of Experts (MoE) внутри LLM (спарсинг активации)
- 849. Что такое expert parallelism для MoE моделей (Mixtral)
- Практика
- 800+ вопросов
- 215. Настроить expert parallelism для Mixtral
- 249. RAG с cost-aware routing