Поиск
- wikiEfficiency
# Efficiency ## Определение Эффективность агента, измеряемая количеством шагов для достижения цели, экономической эффективностью или оптимальностью распределения ресурсов. ## Где встречается - [[139. Как…
- wikidata efficiency
# data efficiency ## Определение Способность алгоритма достигать высокой точности при меньшем количестве размеченных данных. ## Где встречается - [[275. Реализовать active learning loop…
- wikiCache stability
# Cache stability ## Определение Стабильность кэша для общих префиксов, влияющая на эффективность контекстного инжиниринга. Чем выше стабильность, тем чаще могут быть…
- wikimonitoring delegation
# monitoring delegation ## Определение Система мониторинга механизма делегирования задач между AI-агентами, отслеживающая корректность и эффективность распределения работы. ## Где встречается - [[Практика…
- wikilow-quality filtering
# low-quality filtering ## Определение Этап очистки сгенерированных данных (например, synthetic data) для удаления примеров низкого качества, чтобы повысить эффективность instruction…
- wikiPath-level metrics
# Path-level metrics ## Определение Набор метрик для оценки маршрута агента, включая корректность вызова инструментов, последовательность шагов и эффективность. Используются в…
- wikiСтруктурированные промпты
…Повышают эффективность prompt caching и защиту от инъекций. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс терминов|Индекс терминов…
- wikiDelegation Efficiency
# Delegation Efficiency ## Определение Доля задач, решённых с первого раза без повторных эскалаций; целевое значение обычно >85%. ## Где встречается - [[771. Как…
- wikiDeepSeek-R1
# DeepSeek-R1 ## Определение Модель DeepSeek, использующая GRPO для обучения reasoning, показала эффективность с длинными CoT. ## Где встречается - [[328. GRPO (Group…
- wikiOffloading
…Как вы измеряете эффективность speculative decoding|161. Как вы измеряете эффективность speculative decoding]] - [[433. Почему KV cache растет линейно с…
- wikiI/O
…форматами файлов (например, JSONL vs Parquet) и влияет на эффективность конвейеров обработки. ## Где встречается - [[11. Конвертировать датасет из JSONL в…
- wikiKV cache fragmentation
# KV cache fragmentation ## Определение Фрагментация KV-кэша, возникающая при чередовании этапов prefill и decode, что снижает эффективность использования памяти. ## Где…
- wikiPaLM 2
# PaLM 2 ## Определение Языковая модель Google, на которой была продемонстрирована эффективность алгоритма Reinforced Self-Training (ReST). ## Где встречается - [[339. Как…
- wikiValid Efficiency Score
# Valid Efficiency Score ## Определение Метрика, оценивающая корректность и производительность SQL-запроса, учитывая как точность, так и эффективность выполнения. ## Где встречается…
- wikiSubgoal completion rate
…Показывает эффективность декомпозиции и выполнения. ## Где встречается - [[575. Как работает hierarchical planning для агентов (разбивка на подзадачи)|575. Как работает…
- wikiInter-GPU bandwidth
…Влияет на скорость передачи данных и эффективность параллелизации. ## Где встречается - [[224. vLLM кластер на 4 GPU|224. vLLM кластер на…
- wikiFlopCountAnalysis
# FlopCountAnalysis ## Определение Утилита из библиотеки fvcore для подсчёта числа операций с плавающей запятой (FLOPs) модели, помогает оценивать её вычислительную эффективность…
- wikiDivergent control flow
# Divergent control flow ## Определение Ситуация в GPU, когда потоки одного warp выполняют разные ветки условного оператора, что снижает параллельную эффективность…
- wikiEmbedding normalization
# Embedding normalization ## Определение Приведение эмбеддингов к единичной длине (L2-нормализация), что улучшает косинусное сходство и может снижать эффективность некоторых атак…
- wikiКоэффициент полезного делегирования
…Позволяет оценить эффективность распределения подзадач в системах AI-агентов. ## Где встречается - [[773. Как измерять «коэффициент полезного делегирования» (сколько задач решено…
- wikirejection sampling
…Как вы измеряете эффективность speculative decoding|161. Как вы измеряете эффективность speculative decoding]] - [[164. Какие trade-offs между разными архитектурами…
- wikiQwen2.5-MoE
…Позволяет повысить эффективность обработки при сохранении качества. ## Где встречается - [[680. Как работает Mixture of Experts (MoE) внутри LLM (спарсинг активации…
- wikiRetrieval Quality
# Retrieval Quality ## Определение Общая эффективность системы поиска, оцениваемая с помощью метрик, таких как hit rate и MRR, и отлаживаемая через…
- wikiPath Efficiency
…Показывает эффективность маршрута. ## Где встречается - [[501. Что такое Path-level evaluation для Agentic RAG и чем оно лучше token-level…
- wikiAdaptive backoff
# Adaptive backoff ## Определение Стратегия повторных запросов (retry), при которой начальная задержка динамически подстраивается на основе истории ошибок, что повышает эффективность…
- wikiover-pruning
…ветки действий, лишая агента полезных вариантов и снижая его эффективность. ## Где встречается - [[743. Какие есть типичные failure modes в harness…
- wikiSelective state space
# Selective state space ## Определение Механизм в архитектуре Mamba для выборочного обновления скрытого состояния в зависимости от входных данных, улучшающий эффективность…
- wikiCost Engineering
# Cost Engineering ## Определение Дисциплина проектирования, развёртывания и эксплуатации AI-систем с фокусом на экономическую эффективность. Включает анализ полной стоимости владения…
- wikifree-riding
…потребляет общие ресурсы, но не вносит полезный вклад, снижая эффективность системы. ## Где встречается - [[726. Как предотвращать free-riding в multi…
- wikimemory management
…Влияет на эффективность инференса и масштабирование. ## Где встречается - [[188. Что такое «Schema-Activated In-Context Learning» (SA-ICL)|188. Что…
- wikiмногорукий бандит
# многорукий бандит ## Определение Форма онлайн-обучения, где алгоритм выбирает между несколькими вариантами (например, API) с неизвестной эффективностью, балансируя исследование и…
- wikistride
# stride ## Определение Шаг между адресами памяти при доступе; влияет на эффективность memory coalescing и может вызывать bank conflicts в shared…
- wikiRadixAttention
…Увеличивает эффективность инференса за счёт кэширования ранее вычисленных attention-состояний. ## Где встречается - [[206. Что такое KV cache reuse в multi…
- wikiSample Efficiency
# Sample Efficiency ## Определение Способность алгоритма обучаться на ограниченном количестве данных; PPO эффективнее ReST в этом аспекте. ## Где встречается - [[334. Как…
- wikiJamba
…Сочетает эффективность SSM с качеством attention. ## Где встречается - [[713. Как работает Mamba (State Space Model) и чем она лучше трансформера…
- wikiHybrid architecture
# Hybrid architecture ## Определение Архитектура, объединяющая слои Transformer и State Space Model (SSM) для достижения баланса между вычислительной эффективностью и точностью…
- wikiacceptance rate
…Как вы измеряете эффективность speculative decoding|161. Как вы измеряете эффективность speculative decoding]] - [[164. Какие trade-offs между разными архитектурами…
- wikibucketing
…уменьшения избыточного паддинга и устранения динамических форм, что повышает эффективность обучения и инференса. ## Где встречается - [[302. Что такое warp divergence…
- wikiMixture of Experts
…экспертов (например, 2 из 8), что обеспечивает высокую вычислительную эффективность при большом количестве параметров. ## Где встречается - [[304. Что такое FlashAttention…
- wikiCurse of dimensionality
# Curse of dimensionality ## Определение Проблема, при которой с ростом размерности пространства расстояния между точками становятся почти одинаковыми, что снижает эффективность…
- wikiTinyLlama
…Как вы измеряете эффективность speculative decoding|161. Как вы измеряете эффективность speculative decoding]] - [[164. Какие trade-offs между разными архитектурами…
- wikidraft model
…Как вы измеряете эффективность speculative decoding|161. Как вы измеряете эффективность speculative decoding]] - [[164. Какие trade-offs между разными архитектурами…
- wiki8-bit quantization
…Как вы измеряете эффективность speculative decoding|161. Как вы измеряете эффективность speculative decoding]] - [[211. Как вы измеряете и оптимизируете TTFT…
- wikiMixtral
…параметров на каждом токене, что сочетает высокое качество с эффективностью. ## Где встречается - [[368. Как вы оцениваете мультимодальную модель на hallucinations…
- wikiComposite score
# Composite score ## Определение Агрегированная метрика, объединяющая несколько показателей (например, успешность выполнения задачи и эффективность шагов) с весами для общей оценки…
- wikiprefix caching
…Как вы измеряете эффективность speculative decoding|161. Как вы измеряете эффективность speculative decoding]] - [[164. Какие trade-offs между разными архитектурами…
- wikitarget model
…Как вы измеряете эффективность speculative decoding|161. Как вы измеряете эффективность speculative decoding]] - [[164. Какие trade-offs между разными архитектурами…
- answerКак вы измеряете эффективность speculative decoding?
…Как вы измеряете эффективность speculative decoding? ## Краткий тезис [[Вики/Efficiency\|Эффективность]] **[[Вики/speculative decoding\|speculative]] [[Вики/decode\|decoding]]** — техники ускорения…
- wikiBLIP-2
…Показывает высокую эффективность в задачах vision-language, таких как image captioning. ## Где встречается - [[116. Как вы индексируете видео-контент в…
- answerЧто такое mechanism design для multi-agent systems и как применить к LLM-агентам?
…strategy|доминантная стратегия — сообщать истинную оценку. - [[Вики/Efficiency\|Эффективность]]: выбирается социально-оптимальный исход. - [[Вики/individual rationality\|Индивидуальная рациональность]]: платежи неотрицательны…