English translation is not available yet. Showing Russian content.

Up-training

Up-training

Определение

Метод дообучения модели с multi-head attention (MHA), при котором веса преобразуются в grouped-query attention (GQA) через проекции, что позволяет ускорить инференс без значительной потери качества.

Где встречается

Навигация