中文翻译暂不可用,显示俄语原文。
Transformer-XL
Transformer-XL
Определение
Архитектура трансформера с рекуррентностью и кэшем предыдущих сегментов, позволяющая обрабатывать длинные контексты без сжатия.
Где встречается
- 632. Как работает Infini-attention (Google, 2024) для бесконечного контекста
- 57. Настроить recurrent memory для long context