Поиск
- wikiCost Engineering
# Cost Engineering ## Определение Дисциплина проектирования, развёртывания и эксплуатации AI-систем с фокусом на экономическую эффективность. Включает анализ полной стоимости владения…
- wikiEffective cost per token
…Применяется в Cost Engineering для анализа и снижения затрат на LLM-системы. ## Где встречается - [[775. Что такое Cost Engineering для…
- wikiCost optimization
# Cost optimization ## Определение Практика анализа и оптимизации затрат на облачные ресурсы, включая выбор типов инстансов и регионов с учётом частоты…
- wikiCost-aware planner
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiCost per agent run
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiCost per successful answer
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikicost attribution
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] - [[Практика|Практика]] - [[800+ вопросов|800…
- wikiCostTracker
…Как Harness Engineering связан с наблюдаемостью (OpenTelemetry, LangSmith, трассировка)]] - [[800+ вопросов|800+ вопросов]] - [[139. Настроить cost attribution per feature|139…
- wikiLLM-call classifier
…Используется в Cost Engineering LLM-систем. ## Где встречается - [[775. Что такое Cost Engineering для LLM-систем|775. Что такое Cost…
- answerЧто такое Cost Engineering для LLM-систем?
…Определение и контекст [[Вики/Cost optimization\|Cost Engineering]] ([[Вики/Cost Engineering\|инжиниринг стоимости]]) пришёл из классического production-engineering, но в…
- wikiCost optimisation
…Как выглядит process operational excellence в Harness Engineering (ORR, Operational Reviews)|756. Как выглядит process operational excellence в Harness Engineering…
- wikicost-aware routing
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] - [[776. Как считать TCO (Total…
- wikicost management
# cost management ## Определение Комплекс практик и стратегий, направленных на снижение переменных и фиксированных затрат на LLM-продукт. Включает выбор бэкендов…
- wikiAgentExecutor
…Как изменилась роль инженера с приходом Harness Engineering|739. Как изменилась роль инженера с приходом Harness Engineering]] - [[80. Реализовать cost…
- wikiBatching tool calls
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiStructured extraction
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiLunary
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikicapacity planning
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] - [[Практика|Практика]] - [[800+ вопросов|800…
- answerЧто такое Harness Engineering и чем он отличается от Prompt Engineering и MLOps?
…Harness Engineering\|Harness Engineering]]: - [[Вики/monitoring errorslatency\|Observability]] ([[Вики/мониторинг\|наблюдаемость]]) — сбор метрик ([[Вики/Latency\|latency]], [[Вики/cost\|cost]], [[Вики…
- wikiROI
…Как вы оцениваете cost-effectiveness LLM-пайплайна]] - [[775. Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering…
- wikiHaystack
…Какие инструменты и фреймворки существуют для Harness Engineering]] - [[778. Как проектировать cost-aware routing (дешёвая модель для простых запросов, дорогая…
- wikimodel selection
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] - [[800+ вопросов|800+ вопросов]] ## Навигация…
- wikiHelicone
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] - [[800+ вопросов|800+ вопросов]] ## Навигация…
- wikiCUSUM
…Как в Harness Engineering реализована эвалюация и дрейф (evaluation & drift)]] - [[144. Настроить anomaly detection по cost|144. Настроить anomaly detection…
- wikiPrompt compression
…Как вы масштабируете синтетическую генерацию до миллионов примеров (cost optimization)]] - [[748. Как в Harness Engineering реализована эвалюация и дрейф (evaluation…
- answerКак Harness Engineering связан с наблюдаемостью (OpenTelemetry, LangSmith, трассировка)?
…и дорог. [[Вики/Harness-engineering\|Harness]] предоставляет встроенные компоненты [[Вики/TraceManager\|TraceManager]], [[Вики/CostTracker\|CostTracker]], [[Вики/логирование\|Logger]] и [[Вики…
- wikibreak-even point
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] - [[776. Как считать TCO (Total…
- wikicost
…Реализовать cost-aware routing|133. Реализовать cost-aware routing]] - [[139. Настроить cost attribution per feature|139. Настроить cost attribution per…
- wikiLangSmith
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] - [[779. Что такое «token budget…
- wikiconfidence score
…Что такое Delegation Engineering и чем он отличается от Harness Engineering|760. Что такое Delegation Engineering и чем он отличается…
- answerКакие книги или ресурсы вы рекомендуете по Harness Engineering?
…Основные выводы: - Частичное [[Вики/Harness Engineering\|harness]]`ирование даёт **-40% [[Вики/cost\|cost]]** при сохранении качества ответов на задачах QA…
- wikiretry
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] - [[783. Как сравнивать cost efficiency…
- answerЧто такое Partial Harnessing (частичное управление)?
…дополнительного контроля превышает его [[Вики/Inference cost\|стоимость]]. Иными словами, [[Вики/Harness-engineering\|harness]] задаёт: - начальное действие (например, «сформулируй [[Вики…
- wikicost per request
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] - [[776. Как считать TCO (Total…
- wikiPCA
…engineering (RepE) и зачем он нужен]] - [[47. Реализовать query drift детекцию|47. Реализовать query drift детекцию]] - [[77. Реализовать cost-aware…
- wikicaching
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] - [[780. Как измерять ROI от…
- wikiSLO
…Как вы оцениваете cost-effectiveness LLM-пайплайна|504. Как вы оцениваете cost-effectiveness LLM-пайплайна]] - [[532. Что такое data contract…
- wikiLLM endpoint
…Как вы проводим chaos engineering для RAG системы|384. Как вы проводим chaos engineering для RAG системы]] - [[406. Что такое…
- wikiSpot Instances
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] - [[Практика|Практика]] - [[800+ вопросов|800…
- wikiAutoGen
…Что такое Coordination Engineering и чем он отличается от Harness Engineering|753. Что такое Coordination Engineering и чем он отличается…
- wikiSLA
…Что такое Delegation Engineering и чем он отличается от Harness Engineering|760. Что такое Delegation Engineering и чем он отличается…
- wikiConsensus
…Что такое Coordination Engineering и чем он отличается от Harness Engineering|753. Что такое Coordination Engineering и чем он отличается…
- wikiCrewAI
…Что такое Coordination Engineering и чем он отличается от Harness Engineering|753. Что такое Coordination Engineering и чем он отличается…
- wikiOrchestrator
…Что такое Coordination Engineering и чем он отличается от Harness Engineering|753. Что такое Coordination Engineering и чем он отличается…
- wikiLlamaIndex
…Engineering]] - [[800+ вопросов|800+ вопросов]] - [[17. Настроить S3 consistency для RAG|17. Настроить S3 consistency для RAG]] - [[80. Реализовать cost…
- wikiOpenTelemetry
…Что такое Coordination Engineering и чем он отличается от Harness Engineering|753. Что такое Coordination Engineering и чем он отличается…
- wikiToken budgets
…Как считать TCO (Total Cost of Ownership) для RAGAgent системы|776. Как считать TCO (Total Cost of Ownership) для RAGAgent…
- wikistructured output format
…Какие книги или ресурсы вы рекомендуете по Harness Engineering]] - [[783. Как сравнивать cost efficiency разных LLM провайдеров|783. Как сравнивать…
- answerКак проектировать cost-aware routing (дешёвая модель для простых запросов, дорогая — для сложных)?
…Prompt engineering\|запрос]], хотя 60–70% из них могли бы быть обработаны дешёвой моделью. [[Вики/cost-aware routing\|Cost-aware…
- wikiLLM distillation
…Что такое Cost Engineering для LLM-систем|775. Что такое Cost Engineering для LLM-систем]] - [[780. Как измерять ROI от…