Поиск

wikiEncoder-decoder transformer
# Encoder-decoder transformer ## Определение Архитектура Transformer, состоящая из энкодера и декодера с cross-attention, используемая для задач sequence-to-sequence…
wikitransformer block
# transformer block ## Определение Базовый строительный блок трансформера, включающий multi-head self-attention, feed-forward сеть и residual connection с нормализацией…
wikiTransformerBlock
# TransformerBlock ## Определение Базовый компонент архитектуры Transformer, объединяющий механизм внимания и полносвязную нейронную сеть. ## Где встречается - [[480. Как работает selective activation…
wikiTransformer Engine
…Как работает FP8 quantization на H100 (Transformer Engine)|312. Как работает FP8 quantization на H100 (Transformer Engine)]] - [[324. Что такое…
wikiSparse Transformers
# Sparse Transformers ## Определение Sparse Transformers — семейство архитектур трансформеров с разреженным вниманием, которое снижает квадратичную сложность вычислений по сравнению с полным…
wikiUniversal Transformer
# Universal Transformer ## Определение Архитектура нейронной сети, расширяющая Transformer за счёт адаптивного времени вычислений и перекрёстного внимания между слоями. Позволяет модели…
wikiTransformerLens
# TransformerLens ## Определение Инструмент для анализа внутренних состояний и паттернов внимания в Transformer-моделях, применяемый для выявления attention sinks и аномалий…
wikioutliers
…Как работает FP8 quantization на H100 (Transformer Engine)|312. Как работает FP8 quantization на H100 (Transformer Engine)]] - [[458. Что такое…
wikisentence-transformers/all-MiniLM-L6-v2
# sentence-transformers/all-MiniLM-L6-v2 ## Определение Лёгкая модель эмбеддингов предложений из библиотеки sentence-transformers. Часто используется в RAG-системах…
wikisingle-stage autoregressive transformer
# single-stage autoregressive transformer ## Определение Архитектура генерации аудио, использующая одностадийный авторегрессионный трансформер без разделения на этапы. ## Где встречается - [[800+ вопросов…
wikiDETR
# DETR ## Определение Архитектура детекции объектов на основе Transformer, используемая в Table Transformer и grounding. ## Где встречается - [[542. Как вы парсите…
wikiRWKV
# RWKV ## Определение Гибридная архитектура нейронной сети, объединяющая рекуррентные вычисления RNN с механизмом внимания Transformer, обеспечивающая линейную сложность инференса. ## Где встречается…
wikiCompressive Transformer
# Compressive Transformer ## Определение Архитектурный подход к долгосрочной памяти, при котором скрытые состояния рекуррентно сжимаются для эффективного хранения и обработки длинных…
wikiLinear Transformers
# Linear Transformers ## Определение Трансформеры с линейной сложностью attention за счёт изменения порядка умножения матриц. ## Где встречается - [[276. Как работает attention…
wikitransformer_lens
# transformer_lens ## Определение Библиотека для анализа активаций нейросетей с помощью forward hooks; используется в representation engineering для изучения внутренних представлений…
wikiHuggingFace Transformers
# HuggingFace Transformers ## Определение Основная библиотека от Hugging Face, предоставляющая архитектуры и инструменты для работы с трансформерами, включая обучение и оценку…
wikiEncoder-only transformer
# Encoder-only transformer ## Определение Тип трансформера без декодера, применяемый для понимания документов (например, LayoutLMv3) и других задач, где не требуется…
wikiBlockwise Parallel Transformer
# Blockwise Parallel Transformer ## Определение Архитектура трансформера, обрабатывающая длинные последовательности путём параллельного вычисления внимания по блокам для повышения эффективности. ## Где встречается…
wikiединый трансформер
# единый трансформер ## Определение Один decoder-only transformer, обрабатывающий последовательность текстовых и визуальных токенов без раздельных энкодеров, как в мультимодальных моделях…
answerRWKV (RNN with Transformer attention): как комбинирует RNN и attention?
…В отличие от [[Вики/Transformer\|Transformer]], здесь нет [[Вики/Attention\|multi-head attention]] с [[Вики/logits\|softmax]] — вместо этого один…
wikinon-autoregressive transformer
# non-autoregressive transformer ## Определение Архитектура трансформера, предсказывающая все токены последовательности параллельно без зависимости от предыдущих. Применяется в задачах, где допустим…
wikiTransformer-XL
# Transformer-XL ## Определение Архитектура трансформера с рекуррентностью и кэшем предыдущих сегментов, позволяющая обрабатывать длинные контексты без сжатия. ## Где встречается - [[632…
wikiRecurrent Memory Transformer
# Recurrent Memory Transformer ## Определение Модель, использующая повторные проходы скрытых состояний для вычислений на этапе тестирования (test-time compute). ## Где встречается…
wikiBPTT
…RWKV (RNN with Transformer attention) как комбинирует RNN и attention|714. RWKV (RNN with Transformer attention) как комбинирует RNN и…
wikidelayed scaling
# delayed scaling ## Определение Метод калибровки масштабов в Transformer Engine для FP8 quantization на H100, при котором scaling factor применяется с…
wikiMEMIT
# MEMIT ## Определение MEMIT (Mass-Editing Memory in a Transformer) — метод массового редактирования фактов в LLM путём модификации весов, расширяющий ROME…
wikiNeMo
# NeMo ## Определение Библиотека NVIDIA для обучения и fine-tuning LLM, поддерживающая FP8 через Transformer Engine, а также построение диалоговых AI…
wikiSwitch Transformer
# Switch Transformer ## Определение Архитектура Mixture of Experts (MoE) с большим числом экспертов и k=1, предложенная Google; первая крупная MoE…
wikiscaling factors
# scaling factors ## Определение Параметры, используемые Transformer Engine для масштабирования тензоров при конвертации FP16 в FP8, чтобы избежать переполнения. ## Где встречается…
answerКак работает FP8 quantization на H100 (Transformer Engine)?
…Роль Transformer Engine **[[Вики/Transformer Engine\|Transformer Engine]] (TE)** — это программная надстройка над [[Вики/CUDA\|CUDA]] и [[Вики/Tensor Cores…
wikiTransformer
…RWKV (RNN with Transformer attention) как комбинирует RNN и attention|714. RWKV (RNN with Transformer attention) как комбинирует RNN и…
wikitransformers
# transformers ## Определение Библиотека от Hugging Face для загрузки, обучения и инференса предобученных моделей на архитектуре Transformer, широко используемая в NLP…
wikiTable Transformer
# Table Transformer ## Определение Модель на основе DETR для детекции и распознавания таблиц в документах, узкоспециализированная для извлечения табличной информации из…
wikiEncoder
# Encoder ## Определение Часть архитектуры Transformer, обрабатывающая входные данные (например, log-Mel спектрограммы) и преобразующая их в скрытые представления. ## Где встречается…
answerКак вы сравниваете две LLM архитектуры не по accuracy, а по efficiency?
…Transformer vs State Space Models (Mamba) vs Hybrid | Характеристика | Transformer (decoder) | Mamba (SSM) | Hybrid (Transformer + SSM) | |----------------|-----------------------|-------------|----------------------------| | [[Вики/FLOPs\|FLOPs per…
answerЧто такое FP8 инференс на H100 (Transformer Engine)?
…Архитектура H100 и Transformer Engine [[Вики/Transformer Engine\|Transformer Engine]] — это программно-аппаратный [[Вики/Module\|модуль]] на [[Вики/Hopper GPU…
wikiReceptance
…RWKV (RNN with Transformer attention) как комбинирует RNN и attention|714. RWKV (RNN with Transformer attention) как комбинирует RNN и…
wikiE5M2
…Как работает FP8 quantization на H100 (Transformer Engine)|312. Как работает FP8 quantization на H100 (Transformer Engine)]] ## Навигация - [[00. Индекс…
wikiE4M3
…Как работает FP8 quantization на H100 (Transformer Engine)|312. Как работает FP8 quantization на H100 (Transformer Engine)]] ## Навигация - [[00. Индекс…
wikiTrOCR
# TrOCR ## Определение Модель на основе Transformer для распознавания текста, включая рукописный, используемая в OCR для RAG. ## Где встречается - [[550. Как…
wikidecay rate
…RWKV (RNN with Transformer attention) как комбинирует RNN и attention|714. RWKV (RNN with Transformer attention) как комбинирует RNN и…
wikidynamic scaling
…Как работает FP8 quantization на H100 (Transformer Engine)|312. Как работает FP8 quantization на H100 (Transformer Engine)]] ## Навигация - [[00. Индекс…
wikismooth quantization
…Что такое FP8 инференс на H100 (Transformer Engine)|458. Что такое FP8 инференс на H100 (Transformer Engine)]] ## Навигация - [[00. Индекс…
wikioutlier-aware scaling
…Как работает FP8 quantization на H100 (Transformer Engine)|312. Как работает FP8 quantization на H100 (Transformer Engine)]] ## Навигация - [[00. Индекс…
wikiH100
# H100 ## Определение Графический процессор NVIDIA архитектуры Hopper с поддержкой FP8 через Transformer Engine и MIG, ключевой для инференса LLM. ## Где…
wikiWKV
…RWKV (RNN with Transformer attention) как комбинирует RNN и attention|714. RWKV (RNN with Transformer attention) как комбинирует RNN и…
wikiper-tensor scaling
…Что такое FP8 инференс на H100 (Transformer Engine)|458. Что такое FP8 инференс на H100 (Transformer Engine)]] ## Навигация - [[00. Индекс…
wikiViT-L/14
# ViT-L/14 ## Определение Конкретная версия Vision Transformer с размером патча 14x14 пикселей. Применяется как vision encoder в GPT-4V…
answerКак вы парсите сложные PDF с таблицами и графиками (не просто текст)?
…Он включает детекцию и [[Вики/table understanding\|распознавание таблиц]] (с помощью моделей вроде [[Вики/Table Transformer\|Table Transformer]] или инструментов…
wikiRNN
…RWKV (RNN with Transformer attention) как комбинирует RNN и attention|714. RWKV (RNN with Transformer attention) как комбинирует RNN и…