中文翻译暂不可用,显示俄语原文。
Kernel Duration
Kernel Duration
Определение
Время выполнения каждого GPU-ядра, сравниваемое с теоретическим минимумом при профилировании. Метрика помогает выявлять узкие места в инференсе LLM.
中文翻译暂不可用,显示俄语原文。
Время выполнения каждого GPU-ядра, сравниваемое с теоретическим минимумом при профилировании. Метрика помогает выявлять узкие места в инференсе LLM.