Поиск

  • wikitrajectory optimization

    # trajectory optimization ## Определение Оптимизация последовательности действий агента для повышения эффективности, сокращения длины и стоимости выполнения задачи. ## Где встречается - [[895. Как…

  • wikiградиентная оптимизация

    # градиентная оптимизация ## Определение Метод белого ящика для генерации adversarial примеров (например, текста) путём оптимизации через градиенты модели, чтобы эмбеддинг стал…

  • wikiоптимизация промптов

    # оптимизация промптов ## Определение Автоматический подбор промптов и few-shot примеров для улучшения качества ответов LLM, ключевая задача фреймворка DSPy. ## Где…

  • wikigraph optimization

    # graph optimization ## Определение Набор техник (fusion, constant folding, layout optimization, memory pattern), применяемых к вычислительному графу модели для уменьшения времени…

  • wikiMulti-Task Optimization

    # Multi-Task Optimization ## Определение Одновременная оптимизация нескольких шагов цепочки в DSPy, направленная на улучшение общей метрики. Требует валидации, чтобы избежать…

  • wikibenchmark chasing

    # benchmark chasing ## Определение Оптимизация модели под конкретный бенчмарк, а не под реальную задачу; опасна переобучением и неэффективностью в production. ## Где…

  • wikiEvalAI

    …Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику|106. Как вы валидируете, что…

  • wikiAutomatic Prompt Engineering

    …Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику|106. Как вы валидируете, что…

  • wikisize penalty

    …Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику|106. Как вы валидируете, что…

  • wikiDSPy Evaluate

    …Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику|106. Как вы валидируете, что…

  • wikiWilcoxon signed-rank test

    …Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику|106. Как вы валидируете, что…

  • wikipaired t-test

    …Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику|106. Как вы валидируете, что…

  • wikiHold-out validation

    …Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику|106. Как вы валидируете, что…

  • wikifirst-order optimization

    # first-order optimization ## Определение Метод оптимизации, использующий градиенты (производные первого порядка) для поиска минимума функции. В контексте LLM применяется для…

  • wikistatistical power

    …Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику|106. Как вы валидируете, что…

  • wikiGoodhart's law

    …Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику|106. Как вы валидируете, что…

  • wikiauto-tuning

    # auto-tuning ## Определение Автоматическая оптимизация параметров выполнения (например, kernel) под конкретное аппаратное обеспечение для повышения эффективности инференса. ## Где встречается - [[800…

  • wikiweight optimization

    # weight optimization ## Определение Подбор коэффициента w для баланса между векторным и BM25 поиском в гибридном поиске. Используется для настройки вклада…

  • wikiadaptive compute

    # adaptive compute ## Определение Оптимизация времени инференса за счёт динамического распределения вычислительных ресурсов в зависимости от сложности запроса. ## Где встречается - [[68…

  • wikiNCCL_MAX_NCHANNELS

    # NCCL_MAX_NCHANNELS ## Определение Переменная окружения для ограничения числа каналов NCCL, оптимизация загрузки. ## Где встречается - [[9. Профилировать network congestion на…

  • wikiParticle Swarm Optimization

    # Particle Swarm Optimization ## Определение Метод роевого интеллекта, моделирующий социальное поведение частиц для поиска оптимального решения в пространстве параметров. ## Где встречается…

  • wikiКэширование запросов

    # Кэширование запросов ## Определение Pre-retrieval оптимизация, при которой результаты повторяющихся запросов сохраняются в кэше для сокращения времени ответа RAG-системы…

  • wikiCross-Validation

    …Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику|106. Как вы валидируете, что…

  • wikibatch search

    # batch search ## Определение Оптимизация поиска, объединяющая несколько запросов в один или выполняющая их параллельно, чтобы сократить количество шагов и ускорить…

  • wikiIO-awareness

    # IO-awareness ## Определение Принцип работы алгоритмов, таких как FlashAttention, при котором оптимизация производится с учётом операций ввода-вывода между уровнями…

  • wikibunched kernel launches

    # bunched kernel launches ## Определение Оптимизация NCCL, объединяющая запуски ядер для уменьшения накладных расходов. Улучшает производительность на много-GPU системах. ## Где…

  • wikiRAG pipeline

    …Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику|106. Как вы валидируете, что…

  • wikiCost optimisation

    # Cost optimisation ## Определение Автоматические рекомендации по изменению типов инстансов для снижения затрат на облачные ресурсы. ## Где встречается - [[756. Как выглядит…

  • wikiadversarial examples

    …Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику|106. Как вы валидируете, что…

  • wikiHardware acceleration

    # Hardware acceleration ## Определение Оптимизация модели для уменьшения latency. ## Где встречается - [[509. Как вы сравниваете две модели, если у них разная…

  • wikiFixed shapes

    # Fixed shapes ## Определение Оптимизация инференса, при которой длина последовательности и размер батча фиксированы, что позволяет эффективно использовать TensorRT-LLM и…

  • wikiMemory Pattern

    # Memory Pattern ## Определение Оптимизация переиспользования буферов для промежуточных результатов, снижающая пиковое потребление памяти при инференсе. Применяется в компиляторах типа ONNX…

  • wikioveroptimization

    # overoptimization ## Определение Явление, при котором дальнейшая оптимизация proxy reward приводит к ухудшению истинной целевой функции (true objective), часто из-за…

  • wikiLoop unrolling

    # Loop unrolling ## Определение Оптимизация компилятора, при которой цикл с известным числом итераций разворачивается в последовательность операций, уменьшая накладные расходы на…

  • answerКак вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику?

    …Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику? ## Краткий тезис DSPy-оптимизация настраивает…

  • wikiFlashDecoding

    # FlashDecoding ## Определение Оптимизация для инференса LLM, которая ускоряет чтение/запись KV cache и частично скрывает задержки памяти при генерации одного…

  • wikiCommon subexpression elimination

    # Common subexpression elimination ## Определение Оптимизация компилятора, при которой результат повторяющегося выражения сохраняется и переиспользуется, что ускоряет вычисления, особенно в LLM…

  • wikiFlash Decoding

    # Flash Decoding ## Определение Оптимизация decode-этапа инференса LLM через параллельную обработку запросов в batch, что снижает задержку генерации токенов. ## Где…

  • wikibatch write

    # batch write ## Определение Оптимизация записи данных путём накопления операций в буфере с периодическим fsync (или использованием pipeline) для увеличения пропускной…

  • wikiShape specialization

    # Shape specialization ## Определение Оптимизация компиляции LLM-моделей, при которой фиксируются размеры тензоров на этапе компиляции. Это позволяет генерировать более эффективный…

  • answerОбъясните концепцию «программируемых промптов» (DSPy programs). Как это связано с MIPRO?

    …context = self.retrieve(question).passages return self.generate(context=context, question=question) # Компиляция (оптимизация) rag = SimpleRAG() compiled_rag = dspy.Compiler…

  • wikihyperparameter search

    # hyperparameter search ## Определение Процесс автоматического подбора оптимальных гиперпараметров с использованием методов grid, random или bayesian. ## Где встречается - [[103. Какие оптимизаторы…

  • wikikernel

    …LLM-инференс использует kernels для операций attention, matmul и других; оптимизация включает fusion и auto-tuning под конкретное железо. ## Где…

  • wikiglobal memory

    # global memory ## Определение Медленная память GPU, доступная всем потокам; оптимизация LLM требует минимизации обращений к ней. Также может обозначать общую…

  • wikidead code elimination

    # dead code elimination ## Определение Оптимизация графа вычислений, удаляющая операции, результаты которых не влияют на выход модели. Снижает накладные расходы на…

  • wikizero-order search

    # zero-order search ## Определение Перебор дискретных вариантов (промптов, ветвей) без использования градиентов, альтернатива first-order оптимизации. ## Где встречается - [[153. Что…

  • wikiconstant folding

    # constant folding ## Определение Оптимизация, при которой константные выражения вычисляются заранее, уменьшая runtime-нагрузку. ## Где встречается - [[320. Что такое ONNX Runtime…

  • wikiBootstrapFewShot

    …Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику|106. Как вы валидируете, что…

  • wikiстатистическая значимость

    …Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику|106. Как вы валидируете, что…

  • wikit-test

    …Как вы валидируете, что DSPy-оптимизация действительно улучшила модель, а не просто переобучилась под метрику|106. Как вы валидируете, что…