English translation is not available yet. Showing Russian content.

compute utilization

compute utilization

Определение

Процент использования вычислительных блоков GPU (FP32/FP16/Tensor Cores); низкое значение указывает на простой и используется при профилировании производительности LLM serving.

Где встречается

Навигация