Offloading

Offloading

Определение

Перемещение данных (весов, KV cache) из GPU в CPU или на диск при нехватке памяти, используется для инференса с длинными контекстами или гибридных вычислений.

Где встречается

Навигация