Поиск

  • wikiEfficiency

    # Efficiency ## Определение Эффективность агента, измеряемая количеством шагов для достижения цели, экономической эффективностью или оптимальностью распределения ресурсов. ## Где встречается - [[139. Как…

  • wikidata efficiency

    # data efficiency ## Определение Способность алгоритма достигать высокой точности при меньшем количестве размеченных данных. ## Где встречается - [[275. Реализовать active learning loop…

  • wikiCache stability

    # Cache stability ## Определение Стабильность кэша для общих префиксов, влияющая на эффективность контекстного инжиниринга. Чем выше стабильность, тем чаще могут быть…

  • wikimonitoring delegation

    # monitoring delegation ## Определение Система мониторинга механизма делегирования задач между AI-агентами, отслеживающая корректность и эффективность распределения работы. ## Где встречается - [[Практика…

  • wikilow-quality filtering

    # low-quality filtering ## Определение Этап очистки сгенерированных данных (например, synthetic data) для удаления примеров низкого качества, чтобы повысить эффективность instruction…

  • wikiPath-level metrics

    # Path-level metrics ## Определение Набор метрик для оценки маршрута агента, включая корректность вызова инструментов, последовательность шагов и эффективность. Используются в…

  • wikiСтруктурированные промпты

    …Повышают эффективность prompt caching и защиту от инъекций. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс терминов|Индекс терминов…

  • wikiDelegation Efficiency

    # Delegation Efficiency ## Определение Доля задач, решённых с первого раза без повторных эскалаций; целевое значение обычно >85%. ## Где встречается - [[771. Как…

  • wikiDeepSeek-R1

    # DeepSeek-R1 ## Определение Модель DeepSeek, использующая GRPO для обучения reasoning, показала эффективность с длинными CoT. ## Где встречается - [[328. GRPO (Group…

  • wikiOffloading

    …Как вы измеряете эффективность speculative decoding|161. Как вы измеряете эффективность speculative decoding]] - [[433. Почему KV cache растет линейно с…

  • wikiI/O

    …форматами файлов (например, JSONL vs Parquet) и влияет на эффективность конвейеров обработки. ## Где встречается - [[11. Конвертировать датасет из JSONL в…

  • wikiKV cache fragmentation

    # KV cache fragmentation ## Определение Фрагментация KV-кэша, возникающая при чередовании этапов prefill и decode, что снижает эффективность использования памяти. ## Где…

  • wikiPaLM 2

    # PaLM 2 ## Определение Языковая модель Google, на которой была продемонстрирована эффективность алгоритма Reinforced Self-Training (ReST). ## Где встречается - [[339. Как…

  • wikiValid Efficiency Score

    # Valid Efficiency Score ## Определение Метрика, оценивающая корректность и производительность SQL-запроса, учитывая как точность, так и эффективность выполнения. ## Где встречается…

  • wikiSubgoal completion rate

    …Показывает эффективность декомпозиции и выполнения. ## Где встречается - [[575. Как работает hierarchical planning для агентов (разбивка на подзадачи)|575. Как работает…

  • wikiInter-GPU bandwidth

    …Влияет на скорость передачи данных и эффективность параллелизации. ## Где встречается - [[224. vLLM кластер на 4 GPU|224. vLLM кластер на…

  • wikiFlopCountAnalysis

    # FlopCountAnalysis ## Определение Утилита из библиотеки fvcore для подсчёта числа операций с плавающей запятой (FLOPs) модели, помогает оценивать её вычислительную эффективность

  • wikiDivergent control flow

    # Divergent control flow ## Определение Ситуация в GPU, когда потоки одного warp выполняют разные ветки условного оператора, что снижает параллельную эффективность

  • wikiEmbedding normalization

    # Embedding normalization ## Определение Приведение эмбеддингов к единичной длине (L2-нормализация), что улучшает косинусное сходство и может снижать эффективность некоторых атак…

  • wikiКоэффициент полезного делегирования

    …Позволяет оценить эффективность распределения подзадач в системах AI-агентов. ## Где встречается - [[773. Как измерять «коэффициент полезного делегирования» (сколько задач решено…

  • wikirejection sampling

    …Как вы измеряете эффективность speculative decoding|161. Как вы измеряете эффективность speculative decoding]] - [[164. Какие trade-offs между разными архитектурами…

  • wikiQwen2.5-MoE

    …Позволяет повысить эффективность обработки при сохранении качества. ## Где встречается - [[680. Как работает Mixture of Experts (MoE) внутри LLM (спарсинг активации…

  • wikiRetrieval Quality

    # Retrieval Quality ## Определение Общая эффективность системы поиска, оцениваемая с помощью метрик, таких как hit rate и MRR, и отлаживаемая через…

  • wikiPath Efficiency

    …Показывает эффективность маршрута. ## Где встречается - [[501. Что такое Path-level evaluation для Agentic RAG и чем оно лучше token-level…

  • wikiAdaptive backoff

    # Adaptive backoff ## Определение Стратегия повторных запросов (retry), при которой начальная задержка динамически подстраивается на основе истории ошибок, что повышает эффективность

  • wikiover-pruning

    …ветки действий, лишая агента полезных вариантов и снижая его эффективность. ## Где встречается - [[743. Какие есть типичные failure modes в harness…

  • wikiSelective state space

    # Selective state space ## Определение Механизм в архитектуре Mamba для выборочного обновления скрытого состояния в зависимости от входных данных, улучшающий эффективность

  • wikiCost Engineering

    # Cost Engineering ## Определение Дисциплина проектирования, развёртывания и эксплуатации AI-систем с фокусом на экономическую эффективность. Включает анализ полной стоимости владения…

  • wikifree-riding

    …потребляет общие ресурсы, но не вносит полезный вклад, снижая эффективность системы. ## Где встречается - [[726. Как предотвращать free-riding в multi…

  • wikimemory management

    …Влияет на эффективность инференса и масштабирование. ## Где встречается - [[188. Что такое «Schema-Activated In-Context Learning» (SA-ICL)|188. Что…

  • wikiмногорукий бандит

    # многорукий бандит ## Определение Форма онлайн-обучения, где алгоритм выбирает между несколькими вариантами (например, API) с неизвестной эффективностью, балансируя исследование и…

  • wikistride

    # stride ## Определение Шаг между адресами памяти при доступе; влияет на эффективность memory coalescing и может вызывать bank conflicts в shared…

  • wikiRadixAttention

    …Увеличивает эффективность инференса за счёт кэширования ранее вычисленных attention-состояний. ## Где встречается - [[206. Что такое KV cache reuse в multi…

  • wikiSample Efficiency

    # Sample Efficiency ## Определение Способность алгоритма обучаться на ограниченном количестве данных; PPO эффективнее ReST в этом аспекте. ## Где встречается - [[334. Как…

  • wikiJamba

    …Сочетает эффективность SSM с качеством attention. ## Где встречается - [[713. Как работает Mamba (State Space Model) и чем она лучше трансформера…

  • wikiHybrid architecture

    # Hybrid architecture ## Определение Архитектура, объединяющая слои Transformer и State Space Model (SSM) для достижения баланса между вычислительной эффективностью и точностью…

  • wikiacceptance rate

    …Как вы измеряете эффективность speculative decoding|161. Как вы измеряете эффективность speculative decoding]] - [[164. Какие trade-offs между разными архитектурами…

  • wikibucketing

    …уменьшения избыточного паддинга и устранения динамических форм, что повышает эффективность обучения и инференса. ## Где встречается - [[302. Что такое warp divergence…

  • wikiMixture of Experts

    …экспертов (например, 2 из 8), что обеспечивает высокую вычислительную эффективность при большом количестве параметров. ## Где встречается - [[304. Что такое FlashAttention…

  • wikiCurse of dimensionality

    # Curse of dimensionality ## Определение Проблема, при которой с ростом размерности пространства расстояния между точками становятся почти одинаковыми, что снижает эффективность

  • wikiTinyLlama

    …Как вы измеряете эффективность speculative decoding|161. Как вы измеряете эффективность speculative decoding]] - [[164. Какие trade-offs между разными архитектурами…

  • wikidraft model

    …Как вы измеряете эффективность speculative decoding|161. Как вы измеряете эффективность speculative decoding]] - [[164. Какие trade-offs между разными архитектурами…

  • wiki8-bit quantization

    …Как вы измеряете эффективность speculative decoding|161. Как вы измеряете эффективность speculative decoding]] - [[211. Как вы измеряете и оптимизируете TTFT…

  • wikiMixtral

    …параметров на каждом токене, что сочетает высокое качество с эффективностью. ## Где встречается - [[368. Как вы оцениваете мультимодальную модель на hallucinations…

  • wikiComposite score

    # Composite score ## Определение Агрегированная метрика, объединяющая несколько показателей (например, успешность выполнения задачи и эффективность шагов) с весами для общей оценки…

  • wikiprefix caching

    …Как вы измеряете эффективность speculative decoding|161. Как вы измеряете эффективность speculative decoding]] - [[164. Какие trade-offs между разными архитектурами…

  • wikitarget model

    …Как вы измеряете эффективность speculative decoding|161. Как вы измеряете эффективность speculative decoding]] - [[164. Какие trade-offs между разными архитектурами…

  • answerКак вы измеряете эффективность speculative decoding?

    …Как вы измеряете эффективность speculative decoding? ## Краткий тезис [[Вики/Efficiency\|Эффективность]] **[[Вики/speculative decoding\|speculative]] [[Вики/decode\|decoding]]** — техники ускорения…

  • wikiBLIP-2

    …Показывает высокую эффективность в задачах vision-language, таких как image captioning. ## Где встречается - [[116. Как вы индексируете видео-контент в…

  • answerЧто такое mechanism design для multi-agent systems и как применить к LLM-агентам?

    …strategy|доминантная стратегия — сообщать истинную оценку. - [[Вики/Efficiency\|Эффективность]]: выбирается социально-оптимальный исход. - [[Вики/individual rationality\|Индивидуальная рациональность]]: платежи неотрицательны…