Linear attention

Linear attention

Определение

Вариант механизма внимания, заменяющий softmax на другую функцию (например, ядерную аппроксимацию), что позволяет изменить порядок умножения и получить линейную сложность O(n·d²) вместо квадратичной.

Где встречается

Навигация