中文翻译暂不可用,显示俄语原文。

sparse attention

sparse attention

Определение

Механизм внимания, вычисляющий attention только для выбранных пар токенов (локальное окно + глобальные), снижая сложность до O(n·k·d) и позволяя обрабатывать длинные контексты.

Где встречается

Навигация