variance normalization
variance normalization
Определение
Компонент оптимизатора Adam, который адаптивно масштабирует скорость обучения для каждого параметра на основе оценки дисперсии градиентов.
Компонент оптимизатора Adam, который адаптивно масштабирует скорость обучения для каждого параметра на основе оценки дисперсии градиентов.