中文翻译暂不可用,显示俄语原文。
Per-token quantization
Per-token quantization
Определение
Метод квантования, при котором для каждого токена используются отдельные параметры масштабирования, что позволяет точнее представлять распределение значений и уменьшить потери точности.