Поиск
- wikiJIT-компиляция
# JIT-компиляция ## Определение Компиляция модели во время выполнения, используемая в XLA, TorchScript и других фреймворках для ускорения инференса. ## Где встречается…
- wikiперекомпиляция
# перекомпиляция ## Определение Повторная компиляция вычислительного графа (например, в torch.compile) при изменении формы тензоров или других динамических параметров, что может…
- wikiGraph instantiation
# Graph instantiation ## Определение Фаза оптимизации захваченного CUDA-графа, в ходе которой выполняется компиляция и создание готового к многократному запуску объекта…
- wikiJIT compilation
# JIT compilation ## Определение Компиляция во время выполнения для поддержки динамических форм и оптимизации кода под конкретные данные. ## Где встречается - [[317…
- wikiAOT compilation
# AOT compilation ## Определение Компиляция модели машинного обучения в исполняемый бинарный файл до выполнения инференса, характерная для компиляторов типа IREE. Ускоряет…
- wikiBuild engine
# Build engine ## Определение Этап компиляции обученной модели в оптимизированный исполняемый файл (например, .plan для TensorRT) для конкретного устройства, что ускоряет…
- answerКакое будущее у DSPy? Вытеснит ли он LangChain в 2026-2027?
…На больших датасетах компиляция может занимать часы (зато потом работает быстро). - Не подходит для одноразовых сценариев. Если у вас нет…
- answerКак работает Torch Compile (torch.compile) и в чем его ограничения для LLM?
…Memory - Компиляция может увеличить потребление памяти из-за кэширования графов и промежуточных тензоров. - Для больших LLM (70B+) компиляция может занимать…
- answerЧто такое TVM (Apache TVM) и зачем он нужен для AI инференса?
…Ключевые [[Вики/Capability\|возможности]]: - [[Вики/End-to-end\|End-to-end]] компиляция: от высокоуровневого графа вычислений до низкоуровневых инструкций. - Поддержка…
- answerЧто такое torch.compile и как он ускоряет training?
…В таких случаях компиляция не даёт ускорения. ### 5.3 Время первой компиляции Первый вызов скомпилированной функции занимает больше времени из…
- answerКак работает XLA (Accelerated Linear Algebra) для LLM на TPU?
…компиляция LLM inference графа на TPU Рассмотрим упрощённый инференс одного слоя трансформера (attention + FFN) на TPU через JAX: ```python import…
- answerTensorRT-LLM vs vLLM — сравнение для production deployment?
…Сравнение сложности | Аспект | TensorRT-LLM | vLLM | |--------|--------------|------| | Время настройки | 1-2 дня (компиляция, тесты) | 1-2 часа | | Обновление модели | Перекомпиляция | Замена…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Написать pinned memory аллокатор
…Systems | Визуализация overlap (опционально) | | Система сборки | CMake (для C++) | Компиляция CUDA кода | --- ## 4. Этапы выполнения ### Этап 1: Настройка окружения и…
- answerКак вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели?
…поддерживаются на уровне [[Вики/MLIR\|MLIR]], но требуют аккуратного проектирования. - **Компиляция AOT ([[Вики/AOT compilation\|Ahead-of-Time]])**: можно скомпилировать…
- answerЧто такое MLIR и как он используется в IREE/TensorRT-LLM?
…Как работает Torch Compile (torch.compile) и в чем его ограничения для LLM\|316]] | Что такое компиляция ML-моделей и…
- answerКак работает алгоритм ReST (Reinforced Self-Training) и когда он лучше PPO?
…reward — успешная компиляция и прохождение тестов. ReST повышает pass@k. - **Инструктивное следование (Instruction following)**: reward от LLM-судьи (например, GPT…
- answerКакие оптимизаторы (teleprompters) в DSPy вы использовали и когда? BootstrapFewShot, MIPRO, COPRO?
…Чем она отличается от традиционного промпта\|102]] | Как устроена компиляция программы в DSPy? | | [[104. Как вы интегрируете DSPy с RAG…
- answerЧто такое CUDA graphs и как они ускоряют LLM инференс?
…Как вы диагностируете, что проблема в memory bandwidth, а не в compute\|313]] | TensorRT-LLM и компиляция моделей | | [[314. Как…
- answerЧто такое operator fusion в компиляторах и какие паттерны fusion существуют?
…Что такое ONNX Runtime и когда он выгоден для LLM\|320]] | Что такое компиляция вычислительного графа в ML? | | [[321. Как…
- answerОбъясните концепцию «программируемых промптов» (DSPy programs). Как это связано с MIPRO?
…context = self.retrieve(question).passages return self.generate(context=context, question=question) # Компиляция (оптимизация) rag = SimpleRAG() compiled_rag = dspy.Compiler…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать selective scan (Mamba)
…2.x | Forward/backward, интеграция | | Компилятор | nvcc (CUDA Toolkit) | Компиляция `.cu` в `.ptx` / cubin | | Биндинги | torch.utils.cpp_extension | Подключение…
- answerЧто такое tree search agents (MCTS for LLM) и когда они эффективны?
…Например, правильный ответ (0/1), выигрыш в игре, успешная компиляция кода. | | Дискретные действия | Действия — это выбор из конечного набора (функции…
- answerНазовите 4 уровня языкового представления по Yang et al. (2026) и объясните разницу?
…а алгоритм действий. - Можно автоматически проверить [[Вики/Faithfulness\|корректность]] (компиляция, [[Вики/tests\|тесты]]). - Позволяет агентам выполнять вычисления, симуляции, обращаться к…
- answerКак проектировать data contracts для RAG пайплайна?
…кода]] из Protobuf/Avro (например, `protoc` или `avrogen`). 2. Компиляция и юнит-тесты consumer с новой схемой. 3. [[Вики/Validation…
- answerКак вы интегрируете DSPy с RAG-пайплайном? Приведите пример сигнатуры.
…оптимизатором | | Адаптация к новым данным | Требует ручного тестирования | Автоматическая компиляция | | [[Вики/consistency\|Воспроизводимость]] | Низкая (промпты в коде) | Высокая (всё в…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Развернуть NCCL бенчмарк на 2-8 GPU
…и задержки | | Система сборки | CUDA Toolkit >= 11, Make/g++ | Компиляция тестов | | Мониторинг и визуализация | Python (pandas, matplotlib) | Построение графика bandwidth…
- wikiИндекс терминов
…compilation]] - [[Вики/JIT-компилятор|JIT-компилятор]] - [[Вики/JIT-компиляция|JIT-компиляция]] - [[Вики/jitter|jitter]] - [[Вики/Jitter buffer|Jitter buffer]] - [[Вики…