中文翻译暂不可用,显示俄语原文。
gradients
gradients
Определение
Градиенты — это производные функции потерь по параметрам модели, используемые для обновления весов при обучении. В контексте LLM градиенты шардируются в оптимизаторе (ZeRO) и аккумулируются при gradient accumulation.