RMSNorm

RMSNorm

Определение

Упрощённая версия LayerNorm без центрирования, использующая только среднеквадратичное значение; быстрее на 10–15% и применяется в моделях Llama и Mistral.

Где встречается

Навигация