English translation is not available yet. Showing Russian content.

Weight tying

Weight tying

Определение

Приём, при котором матрица эмбеддингов и LM head (unembedding) разделяют одни и те же веса. Часто используется в моделях типа GPT-2 для уменьшения числа параметров.

Где встречается

Навигация