global attention

global attention

Определение

Механизм внимания, при котором определённые токены могут attend ко всем остальным и наоборот, что позволяет обрабатывать длинные последовательности с линейной сложностью O(n) на глобальный токен. Используется в Longformer в комбинации со sliding window attention.

Где встречается

Навигация