中文翻译暂不可用,显示俄语原文。

LongNet

LongNet

Определение

Архитектура с разреженным вниманием (sparse attention), предлагаемая как альтернатива grouped-query attention (GQA) для работы с длинными контекстами.

Где встречается

Навигация