English translation is not available yet. Showing Russian content.

softmax attention

softmax attention

Определение

Механизм внимания, использующий softmax для получения весов внимания. Может приводить к «острым» распределениям и нестабильности градиентов при больших логитах.

Где встречается

Навигация