中文翻译暂不可用,显示俄语原文。
kernel
kernel
Определение
Программный компонент, выполняемый на GPU множеством потоков. LLM-инференс использует kernels для операций attention, matmul и других; оптимизация включает fusion и auto-tuning под конкретное железо.
中文翻译暂不可用,显示俄语原文。
Программный компонент, выполняемый на GPU множеством потоков. LLM-инференс использует kernels для операций attention, matmul и других; оптимизация включает fusion и auto-tuning под конкретное железо.