Поиск
- wikicost-aware routing
…Реализовать cost-aware routing|77. Реализовать cost-aware routing]] - [[80. Реализовать cost attribution per feature|80. Реализовать cost attribution per…
- wikicost attribution
…Реализовать cost attribution per feature|80. Реализовать cost attribution per feature]] - [[132. Настроить cost tracking в production|132. Настроить cost…
- wikiInference cost
# Inference cost ## Определение затраты на выполнение инференса; сравнивается до и после fine-tuning для расчёта ROI ## Где встречается - [[801. Как…
- wikiCost tracking
…Настроить cost tracking для агента|109. Настроить cost tracking для агента]] - [[132. Настроить cost tracking в production|132. Настроить cost…
- wikicost per session
…Настроить cost tracking для агента|109. Настроить cost tracking для агента]] - [[132. Настроить cost tracking в production|132. Настроить cost…
- wikiCost Engineering
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] - [[Практика|Практика]] - [[800+ вопросов|800…
- wikicost reduction
…Реализовать cost-aware routing|133. Реализовать cost-aware routing]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikiCost per good answer
# Cost per good answer ## Определение Метрика cost-effectiveness LLM-пайплайна: отношение общих затрат на LLM к количеству ответов с faithfulness…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить cost tracking в production
…Вы настроите сбор метрик `[[Вики/cost per request\|cost_per_request]]`, `[[Вики/Cost per user\|cost_per_user]]` и `[[Вики…
- wikicost estimator
…Используется для cost-aware кэширования и принятия решений о маршрутизации запросов. ## Где встречается - [[142. Реализовать cost-aware caching|142. Реализовать…
- wikiCost optimization
# Cost optimization ## Определение Практика анализа и оптимизации затрат на облачные ресурсы, включая выбор типов инстансов и регионов с учётом частоты…
- answerКак вы оцениваете cost-effectiveness LLM-пайплайна?
…Cost per good answer [[Вики/Cost per good answer\|Cost per good answer]] ([[Вики/cost\|стоимость]] одного хорошего ответа) — главная…
- wikicost-aware caching
…Реализовать cost-aware caching|142. Реализовать cost-aware caching]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikicost of delegation
# cost of delegation ## Определение Метрика, измеряющая совокупные затраты (токены, задержка, деньги) при передаче подзадачи внешнему инструменту или агенту. Включает стоимость…
- wikiCostTracker
…Настроить cost attribution per feature|139. Настроить cost attribution per feature]] - [[237. Агент с cost tracking|237. Агент с cost…
- wikicost per 1M tokens
…Как сравнивать cost efficiency разных LLM провайдеров|783. Как сравнивать cost efficiency разных LLM провайдеров]] - [[Практика|Практика]] - [[71. Рассчитать cost…
- wikiCost per user
…Настроить cost tracking в production|132. Настроить cost tracking в production]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- answerЧто такое Cost Engineering для LLM-систем?
…Cost Attribution – прозрачность затрат [[Вики/cost attribution\|Cost Attribution]] ([[Вики/cost attribution\|атрибуция затрат]]) – методика, позволяющая ответить на вопрос: «Кто…
- wikicost threshold
…Реализовать cost-aware caching|142. Реализовать cost-aware caching]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikicost_table_version
# cost_table_version ## Определение Метрика для отслеживания версии таблицы стоимости токенов при изменении цен, используемая в cost tracking. ## Где встречается…
- wikiFine-tuning cost
# Fine-tuning cost ## Определение Суммарные затраты на GPU, подготовку датасета и инженерные ресурсы для выполнения fine-tuning модели. ## Где встречается…
- wikicost-quality trade-off
# cost-quality trade-off ## Определение Компромисс между стоимостью и качеством ответа, лежащий в основе cost-aware routing и выбора модели…
- wikiper-feature cost breakdown
# per-feature cost breakdown ## Определение Разбивка затрат на выполнение каждого компонента LLM-пайплайна, например, retrieval, генерация, постобработка, для оценки cost…
- wikicost of reasoning
…Как вы измеряете «cost of reasoning» у агента (не только токены, но и шаги, время, ошибки)|393. Как вы измеряете…
- wikicost per hour
# cost per hour ## Определение Базовая единица стоимости облачного ресурса (виртуальной машины или инстанса), используемая в расчётах total cost. ## Где встречается…
- wikicost per request
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] - [[776. Как считать TCO (Total…
- answerКак вы оцениваете cost-effectiveness LLM-пайплайна?
…Ключевая метрика — [[Вики/Cost per good answer\|Cost per good answer]]: (общие [[Вики/Inference cost\|затраты]] на [[Вики/LLM\|LLM…
- answerКак вы измеряете стоимость агента в production (не только токены)?
…85% Cost per Success: $0.14 LLM Cost Ratio: 60% Human Cost Ratio: 25% Tool Cost Ratio: 10% Infrastructure: 5…
- wikiEffective cost per token
# Effective cost per token ## Определение Стоимость обработки одного токена с учётом кэширования, пакетной обработки и других оптимизаций. Применяется в Cost…
- answerКак измерять ROI от fine-tuning (окупается ли дообучение более дешёвым инференсом)?
…Базовая формула: `[[Вики/ROI\|ROI]] = (Cost_before − Cost_after − [[Вики/Fine-tuning cost\|Cost_finetune]]) / [[Вики/Fine-tuning cost\|Cost…
- wikicost per vector
…Как вы управляете cost хранения векторной БД при миллиарде векторов|525. Как вы управляете cost хранения векторной БД при миллиарде…
- wikitiktoken
…Реализовать cost attribution per feature|80. Реализовать cost attribution per feature]] - [[109. Настроить cost tracking для агента|109. Настроить cost…
- wikicost management
# cost management ## Определение Комплекс практик и стратегий, направленных на снижение переменных и фиксированных затрат на LLM-продукт. Включает выбор бэкендов…
- wikiCost per Delegation Path
# Cost per Delegation Path ## Определение Метрика, представляющая стоимость каждого пути делегирования в многоагентной системе, используется для выбора оптимального маршрута. ## Где…
- wikirunaway costs
# runaway costs ## Определение Неконтролируемый рост затрат на инференс LLM, предотвращаемый настройкой token budget. ## Где встречается - [[Практика|Практика]] - [[134. Настроить token…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить anomaly detection по cost
…Написать Python-скрипт `generate_synthetic_cost.py`, который создаёт CSV-файл с колонками: `[[Вики/timestamp\|timestamp]]`, `[[Вики/Inference cost\|cost…
- answerКак сравнивать cost efficiency разных LLM провайдеров?
…4. **[[Вики/Cost per good answer\|Cost per good answer]] = [[Вики/cost per request\|cost per task]] / ([[Вики/stake\|доля…
- wikiAPI costs
# API costs ## Определение Затраты на токены при вызове коммерческих LLM, основной компонент операционных расходов в инференсе. ## Где встречается - [[139. Как…
- wikiLatency costs
# Latency costs ## Определение Косвенные потери, вызванные медленными ответами LLM, например падение конверсии. Критичны для пользовательского опыта. ## Где встречается - [[139. Как…
- wikitoken cost
# token cost ## Определение Стоимость генерации одного токена моделью; метрика, используемая для сравнения эффективности методов инференса и оценки общих затрат на…
- answerЧто такое «cost per good answer» и как его измерять?
…В отличие от **[[Вики/cost per request\|cost per request]]** ([[Вики/cost per request\|стоимость одного запроса]]), [[Вики/Cost per…
- answerКак измерять «стоимость делегирования» (токены + время + деньги)?
…Предлагается формула: `[[Вики/cost of delegation\|Cost_delegation]] = Σ(шаг_i) [cost_вызова_i + latency_i + penalty_за_ошибку_i…
- wikiCost-aware planner
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiHuman evaluation costs
# Human evaluation costs ## Определение Затраты на оплату аннотаторов для проведения human evaluation. Является дорогим, но необходимым компонентом оценки faithfulness и…
- wikiStorage costs
# Storage costs ## Определение Расходы, связанные с хранением данных (векторных индексов, кэша, логов), которые влияют на общую стоимость эксплуатации LLM-пайплайна…
- wikiCost per agent run
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiCompute costs
# Compute costs ## Определение Затраты на аренду GPU/TPU для self-hosted моделей; зависят от размера модели, пропускной способности и выбранного…
- wikiCost per successful answer
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] ## Навигация - [[00. Индекс терминов|Индекс…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить cost tracking для агента
…записать `[[Вики/cost per session\|cost_per_session]] = sum([[Вики/cost\|cost]] за все шаги)` в гистограмму или [[Вики/summarization…
- wikicost anomaly detection
…Настроить anomaly detection по cost|144. Настроить anomaly detection по cost]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…