中文翻译暂不可用,显示俄语原文。

softmax attention

softmax attention

Определение

Механизм внимания, использующий softmax для получения весов внимания. Может приводить к «острым» распределениям и нестабильности градиентов при больших логитах.

Где встречается

Навигация