LongNet

LongNet

Определение

Архитектура с разреженным вниманием (sparse attention), предлагаемая как альтернатива grouped-query attention (GQA) для работы с длинными контекстами.

Где встречается

Навигация