Kernel Duration
Kernel Duration
Определение
Время выполнения каждого GPU-ядра, сравниваемое с теоретическим минимумом при профилировании. Метрика помогает выявлять узкие места в инференсе LLM.
Время выполнения каждого GPU-ядра, сравниваемое с теоретическим минимумом при профилировании. Метрика помогает выявлять узкие места в инференсе LLM.