中文翻译暂不可用,显示俄语原文。

kernel fusion

kernel fusion

Определение

Объединение нескольких последовательных операций в один CUDA-кернел для уменьшения overhead запуска и обращений к HBM. Промежуточные результаты остаются в shared memory/регистрах, повышая пропускную способность LLM-сервинга.

Где встречается

Навигация