sparse attention

sparse attention

Определение

Механизм внимания, вычисляющий attention только для выбранных пар токенов (локальное окно + глобальные), снижая сложность до O(n·k·d) и позволяя обрабатывать длинные контексты.

Где встречается

Навигация