gpu-memory-utilization

gpu-memory-utilization

Определение

Параметр vLLM, определяющий долю видеопамяти GPU, используемую для инференса. Влияет на возможность включения chunked prefill и общую производительность.

Где встречается

Навигация