中文翻译暂不可用,显示俄语原文。

gradients

gradients

Определение

Градиенты — это производные функции потерь по параметрам модели, используемые для обновления весов при обучении. В контексте LLM градиенты шардируются в оптимизаторе (ZeRO) и аккумулируются при gradient accumulation.

Где встречается

Навигация