English translation is not available yet. Showing Russian content.

subtract max

subtract max

Определение

Техника численной стабильности softmax: вычитание максимального logit перед вычислением экспоненты предотвращает переполнение. Не решает проблему vanishing gradients при больших значениях.

Где встречается

Навигация