中文翻译暂不可用,显示俄语原文。
Preemption by swap
Preemption by swap
Определение
Стратегия вытеснения, при которой KV cache выгружается из GPU в CPU RAM при нехватке памяти, а при возобновлении загружается обратно.
中文翻译暂不可用,显示俄语原文。
Стратегия вытеснения, при которой KV cache выгружается из GPU в CPU RAM при нехватке памяти, а при возобновлении загружается обратно.