English translation is not available yet. Showing Russian content.
Universal Transformer
Universal Transformer
Определение
Архитектура нейронной сети, расширяющая Transformer за счёт адаптивного времени вычислений и перекрёстного внимания между слоями. Позволяет модели динамически выбирать глубину обработки для каждого токена.