中文翻译暂不可用,显示俄语原文。

Universal Transformer

Universal Transformer

Определение

Архитектура нейронной сети, расширяющая Transformer за счёт адаптивного времени вычислений и перекрёстного внимания между слоями. Позволяет модели динамически выбирать глубину обработки для каждого токена.

Где встречается

Навигация