Поиск

  • answerЧто такое MLIR и как он используется в IREE/TensorRT-LLM?

    …Что такое MLIR и как он используется в IREE/TensorRT-LLM? ## Краткий тезис **[[Вики/MLIR\|MLIR]] ([[Вики/MLIR\|Multi-Level…

  • wikiTorch-MLIR

    # Torch-MLIR ## Определение Проект для импорта PyTorch моделей в промежуточное представление MLIR (Multi-Level Intermediate Representation), используемое для оптимизации и…

  • wikiDialect

    # Dialect ## Определение В компиляторной инфраструктуре MLIR — набор операций и типов, абстрагирующих определённый уровень представления (например, арифметику, управляющие структуры). Позволяет строить…

  • wikiMLIR

    …Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…

  • wikiSCF

    # SCF ## Определение Диалект MLIR для представления структурированного потока управления. ## Где встречается - [[317. Что такое MLIR и как он используется в…

  • wikiStableHLO

    # StableHLO ## Определение стабильный высокоуровневый диалект MLIR для импорта моделей ## Где встречается - [[317. Что такое MLIR и как он используется в…

  • wikiPass

    # Pass ## Определение Проход в компиляторе MLIR, выполняющий преобразование или оптимизацию промежуточного представления (IR). ## Где встречается - [[317. Что такое MLIR и…

  • wikiMHLO

    # MHLO ## Определение Высокоуровневый диалект MLIR, предшественник StableHLO, используемый для представления операций машинного обучения. ## Где встречается - [[317. Что такое MLIR и…

  • wikiLinalg

    # Linalg ## Определение Диалект MLIR, предоставляющий операции линейной алгебры, используемый для оптимизации вычислений в фреймворках вроде TensorRT-LLM. ## Где встречается - [[317…

  • wikiLowering

    # Lowering ## Определение Процесс преобразования высокоуровневого представления (диалекта) в низкоуровневое в компиляторах (MLIR), а также метрика перехода пользователей по воронке в…

  • wikiIREE

    # IREE ## Определение Компилятор и среда выполнения для ML-моделей на базе MLIR, поддерживающий различные бэкенды (CPU, GPU, NPU, FPGA) и…

  • wikiJIT compilation

    …Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…

  • wikicode generation

    …Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…

  • answerКак вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели?

    …Особенности - MLIR-based: использует многоуровневое [[Вики/isotonic regression\|промежуточное представление]] ([[Вики/MLIR\|MLIR]]) для оптимизаций. - Гетерогенность: поддерживает [[Вики/Vulkan\|Vulkan…

  • wikiTriton Inference Server

    …Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…

  • wikiGPTQ

    …Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…

  • wikiAWQ

    …Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…

  • wikiTensorRT-LLM

    # TensorRT-LLM ## Определение Библиотека от NVIDIA для оптимизации инференса LLM на GPU, использующая MLIR и операторные оптимизации. Обеспечивает высокую производительность…

  • wikikernel fusion

    …Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…

  • answerЧто такое operator fusion в компиляторах и какие паттерны fusion существуют?

    …TVM]], [[Вики/XLA\|XLA]], [[Вики/TensorRT-LLM\|TensorRT]], [[Вики/MLIR\|MLIR]]) распознают и применяют автоматически. ### 2.1 Pointwise fusion (поэлементное…

  • wikiPaged Attention

    …Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…

  • wikicontinuous batching

    …Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…

  • wikiQuantization

    …Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…

  • answerКак работает graph optimization в LLM компиляторах (constant folding, dead code elimination)?

    …графа и [[Вики/Inductor\|TorchInductor]] для генерации кода. | | [[Вики/MLIR\|MLIR]] | LLVM | Многоуровневое IR, позволяет применять оптимизации на разных уровнях…

  • wikiKV-cache

    …Что такое MLIR и как он используется в IREETensorRT-LLM|317. Что такое MLIR и как он используется в IREETensorRT…

  • answerКак работает Torch Compile (torch.compile) и в чем его ограничения для LLM?

    …Что такое MLIR и как он используется в IREETensorRT-LLM\|317]] | Quantization (квантизация) моделей | | [[318. TensorRT-LLM vs vLLM — сравнение…

  • answerTensorRT-LLM vs vLLM — сравнение для production deployment?

    …Что такое MLIR и как он используется в IREETensorRT-LLM\|317]] | Развертывание LLM в production | | [[319. Как работает XLA (Accelerated…

  • answerКак работает NVLink Switch System на DGX H100?

    …Что такое MLIR и как он используется в IREETensorRT-LLM\|317]] | Сравнение NVLink и InfiniBand для распределённого обучения | | [[318. TensorRT…

  • answerКак работает XLA (Accelerated Linear Algebra) для LLM на TPU?

    …Что такое MLIR и как он используется в IREETensorRT-LLM\|317]] | JAX vs PyTorch для TPU | | [[316. Как работает Torch…

  • answerЧто такое ONNX Runtime и когда он выгоден для LLM?

    …Что такое MLIR и как он используется в IREETensorRT-LLM\|317]] | Развёртывание LLM на edge-устройствах | --- ## Навигация (Obsidian) - Предыдущий: [[319…

  • wikiИндекс терминов

    …Вики/MLflow|MLflow]] - [[Вики/MLflow Tracing|MLflow Tracing]] - [[Вики/MLIR|MLIR]] - [[Вики/mlnx-ofed-kernel-dkms|mlnx-ofed-kernel-dkms…

  • indexИндекс разборов

    …Что такое MLIR и как он используется в IREETensorRT-LLM\|317. Что такое MLIR и как он используется в IREE…

  • indexПРАКТИЧЕСКИЙ ЧЕКЛИСТ: СТАFF+ AI SYSTEMS ENGINEERING

    …Compiler & Runtime Optimization (316-325) | Вопрос | Тема | Практические задачи (#) | |--------|------|------------------------| | 316 | Torch Compile | Pet 224 | | 317 | MLIR | — (инфра) | | 318 | TensorRT-LLM…

  • indexОглавление

    …Что такое MLIR и как он используется в IREETensorRT-LLM\|317. Что такое MLIR и как он используется в IREE…

  • question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)

    …Что такое MLIR и как он используется в IREE/TensorRT-LLM?** > *Ответ:* Multi-Level Intermediate Representation — фреймворк для компиляции ML…