In-place rollback
In-place rollback
Определение
Техника отката KV кэша путём изменения указателя длины без копирования данных, применяется в оптимизированных инференс-движках (vLLM, TensorRT-LLM).
Техника отката KV кэша путём изменения указателя длины без копирования данных, применяется в оптимизированных инференс-движках (vLLM, TensorRT-LLM).