per-tensor scaling
per-tensor scaling
Определение
Метод квантования, при котором один коэффициент масштабирования применяется ко всему тензору, что упрощает реализацию, но может снижать точность по сравнению с поканальным.
Метод квантования, при котором один коэффициент масштабирования применяется ко всему тензору, что упрощает реализацию, но может снижать точность по сравнению с поканальным.