中文翻译暂不可用,显示俄语原文。

StreamingLLM

StreamingLLM

Определение

Техника для работы с бесконечным контекстом: сохраняет начальные якорные токены и последнее окно, а остальные отбрасывает для сжатия KV cache.

Где встречается

Навигация