Global + Local Attention
Global + Local Attention
Определение
Комбинация механизмов внимания, где часть токенов имеет глобальный доступ ко всем токенам, а остальные — только к локальному окну, используется в BigBird и Longformer.
Комбинация механизмов внимания, где часть токенов имеет глобальный доступ ко всем токенам, а остальные — только к локальному окну, используется в BigBird и Longformer.