Поиск

  • wikiHLO

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели|325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA…

  • wikiModel Compiler

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели|325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA…

  • wikiAOT compilation

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели|325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA…

  • wikibuild time

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели|325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA…

  • wikiIREE

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели|325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA…

  • wikiMLIR

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели|325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA…

  • wikiXLA

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели|325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA…

  • wikidynamic shapes

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели|325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA…

  • wikiONNX

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели|325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA…

  • wikiTriton Inference Server

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели|325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA…

  • wiki8-bit quantization

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели|325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA…

  • wikikernel fusion

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели|325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA…

  • answerЧто такое operator fusion в компиляторах и какие паттерны fusion существуют?

    …Паттерны operator fusion Существует несколько основных паттернов, которые компиляторы ([[Вики/Apache TVM\|TVM]], [[Вики/XLA\|XLA]], [[Вики/TensorRT-LLM\|TensorRT…

  • answerКак работает graph optimization в LLM компиляторах (constant folding, dead code elimination)?

    …Что такое LLM компиляторы и зачем нужна оптимизация графа [[Вики/LLM\|LLM]] компилятор — это специализированная программа, которая преобразует высокоуровневое описание…

  • wikiTensorRT-LLM

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели|325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA…

  • wikithroughput

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели|325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA…

  • answerЧто такое TVM (Apache TVM) и зачем он нужен для AI инференса?

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели\|325]] | Что такое XLA и как он работает? | | [[326…

  • answerКак вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели?

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели? ## Краткий тезис Сравнение компиляторов моделей — это многокритериальная задача, выходящая…

  • answerЧто такое MLIR и как он используется в IREE/TensorRT-LLM?

    …Зачем нужен [[Вики/MLIR\|MLIR]] - Традиционные компиляторы ([[Вики/LLVM\|LLVM]], GCC) плохо справляются с оптимизациями, специфичными для ML (например, [[Вики…

  • answerКак работает RLHF (Reinforcement Learning from Human Feedback) технически?

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели\|325]] | Что такое alignment и зачем он нужен? | | [[327…

  • answerЧто такое kernel fusion и как он применяется в LLM serving?

    …store(output_ptr + offsets, output, mask=mask) ``` ### 4.3 Компиляторы (TVM, TensorRT, XLA) Библиотеки вроде [[Вики/TensorRT-LLM\|TensorRT]] и…

  • answerКак вы деплоите LLM с TensorRT-LLM в production?

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели\|325]] | Деплой с TGI | | [[326. Как работает RLHF (Reinforcement…

  • answerGRPO (Group Relative Policy Optimization) vs PPO — чем отличается и зачем нужен?

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели\|325]] | Fine-tuning LLM | | [[331. Как вы измеряете quality…

  • indexИндекс разборов

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели\|325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA…

  • indexОглавление

    …Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели\|325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA…

  • question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)

    …COMPILER & RUNTIME OPTIMIZATION (10 вопросов) *Следующий уровень после CUDA — компиляторы.* **316. Как работает Torch Compile (torch.compile) и в чем…