English translation is not available yet. Showing Russian content.
Vanilla Transformer
Vanilla Transformer
Определение
Vanilla Transformer — это исходная архитектура Transformer, в которой используется сегментное разбиение текста без механизма рекуррентности. Эффективный контекст модели ограничен размером одного сегмента (например, 512 токенов), что не позволяет учитывать зависимости между сегментами при обработке длинных последовательностей.