Поиск
- answerЧто такое MLIR и как он используется в IREE/TensorRT-LLM?
…Что такое MLIR и как он используется в IREE/TensorRT-LLM? ## Краткий тезис **[[Вики/MLIR\|MLIR]] ([[Вики/MLIR\|Multi-Level…
- wikiTorch-MLIR
# Torch-MLIR ## Определение Проект для импорта PyTorch моделей в промежуточное представление MLIR (Multi-Level Intermediate Representation), используемое для оптимизации и…
- wikiDialect
# Dialect ## Определение В компиляторной инфраструктуре MLIR — набор операций и типов, абстрагирующих определённый уровень представления (например, арифметику, управляющие структуры). Позволяет строить…
- wikiMLIR
…Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…
- wikiSCF
# SCF ## Определение Диалект MLIR для представления структурированного потока управления. ## Где встречается - [[317. Что такое MLIR и как он используется в…
- wikiStableHLO
# StableHLO ## Определение стабильный высокоуровневый диалект MLIR для импорта моделей ## Где встречается - [[317. Что такое MLIR и как он используется в…
- wikiPass
# Pass ## Определение Проход в компиляторе MLIR, выполняющий преобразование или оптимизацию промежуточного представления (IR). ## Где встречается - [[317. Что такое MLIR и…
- wikiMHLO
# MHLO ## Определение Высокоуровневый диалект MLIR, предшественник StableHLO, используемый для представления операций машинного обучения. ## Где встречается - [[317. Что такое MLIR и…
- wikiLinalg
# Linalg ## Определение Диалект MLIR, предоставляющий операции линейной алгебры, используемый для оптимизации вычислений в фреймворках вроде TensorRT-LLM. ## Где встречается - [[317…
- wikiLowering
# Lowering ## Определение Процесс преобразования высокоуровневого представления (диалекта) в низкоуровневое в компиляторах (MLIR), а также метрика перехода пользователей по воронке в…
- wikiIREE
# IREE ## Определение Компилятор и среда выполнения для ML-моделей на базе MLIR, поддерживающий различные бэкенды (CPU, GPU, NPU, FPGA) и…
- wikiJIT compilation
…Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…
- wikicode generation
…Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…
- answerКак вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели?
…Особенности - MLIR-based: использует многоуровневое [[Вики/isotonic regression\|промежуточное представление]] ([[Вики/MLIR\|MLIR]]) для оптимизаций. - Гетерогенность: поддерживает [[Вики/Vulkan\|Vulkan…
- wikiTriton Inference Server
…Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…
- wikiGPTQ
…Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…
- wikiAWQ
…Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…
- wikiTensorRT-LLM
# TensorRT-LLM ## Определение Библиотека от NVIDIA для оптимизации инференса LLM на GPU, использующая MLIR и операторные оптимизации. Обеспечивает высокую производительность…
- wikikernel fusion
…Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…
- answerЧто такое operator fusion в компиляторах и какие паттерны fusion существуют?
…TVM]], [[Вики/XLA\|XLA]], [[Вики/TensorRT-LLM\|TensorRT]], [[Вики/MLIR\|MLIR]]) распознают и применяют автоматически. ### 2.1 Pointwise fusion (поэлементное…
- wikiPaged Attention
…Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…
- wikicontinuous batching
…Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…
- wikiQuantization
…Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…
- answerКак работает graph optimization в LLM компиляторах (constant folding, dead code elimination)?
…графа и [[Вики/Inductor\|TorchInductor]] для генерации кода. | | [[Вики/MLIR\|MLIR]] | LLVM | Многоуровневое IR, позволяет применять оптимизации на разных уровнях…
- wikiKV-cache
…Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…
- answerКак работает Torch Compile (torch.compile) и в чем его ограничения для LLM?
…Что такое MLIR и как он используется в IREETensorRT-LLM\|317]] | Quantization (квантизация) моделей | | [[318. TensorRT-LLM vs vLLM — сравнение…
- answerTensorRT-LLM vs vLLM — сравнение для production deployment?
…Что такое MLIR и как он используется в IREETensorRT-LLM\|317]] | Развертывание LLM в production | | [[319. Как работает XLA (Accelerated…
- answerКак работает NVLink Switch System на DGX H100?
…Что такое MLIR и как он используется в IREETensorRT-LLM\|317]] | Сравнение NVLink и InfiniBand для распределённого обучения | | [[318. TensorRT…
- answerКак работает XLA (Accelerated Linear Algebra) для LLM на TPU?
…Что такое MLIR и как он используется в IREETensorRT-LLM\|317]] | JAX vs PyTorch для TPU | | [[316. Как работает Torch…
- answerЧто такое ONNX Runtime и когда он выгоден для LLM?
…Что такое MLIR и как он используется в IREETensorRT-LLM\|317]] | Развёртывание LLM на edge-устройствах | --- ## Навигация (Obsidian) - Предыдущий: [[319…
- wikiИндекс терминов
…Вики/MLflow|MLflow]] - [[Вики/MLflow Tracing|MLflow Tracing]] - [[Вики/MLIR|MLIR]] - [[Вики/mlnx-ofed-kernel-dkms|mlnx-ofed-kernel-dkms…
- indexИндекс разборов
…Что такое MLIR и как он используется в IREETensorRT-LLM\|317. Что такое MLIR и как он используется в IREE…
- indexПРАКТИЧЕСКИЙ ЧЕКЛИСТ: СТАFF+ AI SYSTEMS ENGINEERING
…Compiler & Runtime Optimization (316-325) | Вопрос | Тема | Практические задачи (#) | |--------|------|------------------------| | 316 | Torch Compile | Pet 224 | | 317 | MLIR | — (инфра) | | 318 | TensorRT-LLM…
- indexОглавление
…Что такое MLIR и как он используется в IREETensorRT-LLM\|317. Что такое MLIR и как он используется в IREE…
- question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)
…Что такое MLIR и как он используется в IREE/TensorRT-LLM?** > *Ответ:* Multi-Level Intermediate Representation — фреймворк для компиляции ML…