中文翻译暂不可用,显示俄语原文。

Weight tying

Weight tying

Определение

Приём, при котором матрица эмбеддингов и LM head (unembedding) разделяют одни и те же веса. Часто используется в моделях типа GPT-2 для уменьшения числа параметров.

Где встречается

Навигация