English translation is not available yet. Showing Russian content.

kernel fusion

kernel fusion

Определение

Объединение нескольких последовательных операций в один CUDA-кернел для уменьшения overhead запуска и обращений к HBM. Промежуточные результаты остаются в shared memory/регистрах, повышая пропускную способность LLM-сервинга.

Где встречается

Навигация