num_heads

Определение

Параметр архитектуры модели, задающий количество голов внимания в слое multi-head attention.