中文翻译暂不可用,显示俄语原文。

RMSNorm

RMSNorm

Определение

Упрощённая версия LayerNorm без центрирования, использующая только среднеквадратичное значение; быстрее на 10–15% и применяется в моделях Llama и Mistral.

Где встречается

Навигация