Retention Rate
Retention Rate
Определение
Доля токенов, сохраняемых в сжатом KV cache (например, 20%), для оптимизации памяти при работе с длинными контекстами.
Доля токенов, сохраняемых в сжатом KV cache (например, 20%), для оптимизации памяти при работе с длинными контекстами.