中文翻译暂不可用,显示俄语原文。

LLM kernels

LLM kernels

Определение

Оптимизированные GPU-программы (ядра) для выполнения операций LLM, таких как умножение матриц и внимание; нацелены на минимизацию ветвлений и эффективное использование памяти.

Где встречается

Навигация