KV-cache reuse

KV-cache reuse

Определение

Техника ускорения инференса, при которой кэш ключей и значений предыдущих шагов сохраняется и переиспользуется для общих частей промпта в многошаговых диалогах.

Где встречается

Навигация