Mistral

Mistral

Определение

Семейство языковых моделей, использующих RMSNorm вместо LayerNorm и sliding window attention с окном 4096 токенов для эффективной обработки длинных контекстов.

Где встречается

Навигация