Как считать TCO (Total Cost of Ownership) для RAG/Agent системы?

Q: Краткий тезис

**[[Вики/TCO\|TCO]] ([[Вики/TCO\|Total Cost of Ownership]])** для RAG/Agent-системы — это совокупность всех затрат на владение и эксплуатацию системы на протяжении выбранного периода (обычно 3 года). Его разбивают на четыре компонента: [[Вики/CapEx\|CapEx]] ([[Вики/CapEx\|капитальные затраты]]), [[Вики/OpEx\|OpEx]] ([[Вики/OpEx\|операционные затраты]]), [[Вики/DevEx\|DevEx]] ([[Вики/Inference cost\|затраты]] на разработку) и [[Вики/RiskEx\|RiskEx]] ([[Вики/Inference cost\|стоимость]] рисков). Дл

Q: 1. Определение TCO и его значение для RAG/Agent систем

**[[Вики/TCO\|TCO]] ([[Вики/TCO\|Total Cost of Ownership]])** — методология учёта всех прямых и косвенных затрат, связанных с приобретением, развёртыванием, эксплуатацией и выводом из эксплуатации IT-системы. В контексте RAG/Agent-систем [[Вики/TCO\|TCO]] включает: - [[Вики/Inference cost\|Стоимость]] GPU-серверов, облачных ресурсов, API-вызовов.

Q: 2. Компонент CapEx (капитальные затраты)

**[[Вики/CapEx\|CapEx]] ([[Вики/CapEx\|Capital Expenditure]])** — единовременные инвестиции в приобретение оборудования и лицензий.

Q: 2.1. GPU-серверы

- Для локального развёртывания [[Вики/GPT-4o\|LLM]] (open-source [[Вики/model\|модель]] типа [[Вики/GPT-4o\|Llama 3]], [[Вики/Mistral\|Mistral]], [[Вики/Qwen 2.5 1.5B\|Qwen]]) требуются мощные серверы. - Пример: **[[Вики/A100\|NVIDIA A100]] (80GB)** — ~$10–15k за штуку, для инференса модели 70B нужно минимум 4 карты.

Q: 2.2. Лицензии ПО

Q: 2.3. Сетевая инфраструктура

- Брандмауэры, балансировщики нагрузки (если [[Вики/self-hosted\|on-premise]]). Формула [[Вики/CapEx\|CapEx]] CapEx = (сумма закупок оборудования + лицензии + пуско-наладочные работы) Обычно амортизируется за 3 года (годовая норма = [[Вики/CapEx\|CapEx]] / 3). ---

Q: 3. Компонент OpEx (операционные затраты)

**[[Вики/OpEx\|OpEx]] ([[Вики/OpEx\|Operational Expenditure]])** — регулярные расходы на поддержку работающей системы.

Q: 3.1. Облачные ресурсы (IaaS/PaaS)

Краткий тезис

TCO (Total Cost of Ownership) для RAG/Agent-системы — это совокупность всех затрат на владение и эксплуатацию системы на протяжении выбранного периода (обычно 3 года). Его разбивают на четыре компонента: CapEx (капитальные затраты), OpEx (операционные затраты), DevEx (затраты на разработку) и RiskEx (стоимость рисков). Для корректного расчёта необходимо учесть не только очевидные расходы на инфраструктуру и API, но и скрытые издержки, такие как зарплаты инженеров, стоимость галлюцинаций и compliance-затраты. Система с низким TCO не всегда лучшая — нужно балансировать между стоимостью и качеством ответов.

1. Определение TCO и его значение для RAG/Agent систем

TCO (Total Cost of Ownership) — методология учёта всех прямых и косвенных затрат, связанных с приобретением, развёртыванием, эксплуатацией и выводом из эксплуатации IT-системы. В контексте RAG/Agent-систем TCO включает:

Стоимость GPU-серверов, облачных ресурсов, API-вызовов.
Зарплаты ML-инженеров, DevOps, Data Engineers.
Затраты на устранение последствий галлюцинаций и репутационные потери.
Compliance-издержки (GDPR, HIPAA и т.д.).

Почему TCO критичен для RAG/Agent? Потому что архитектура таких систем предполагает многократные вызовы LLM, высокие требования к latency, постоянную поддержку актуальности базы знаний. Неучтённые затраты (например, на fine-tuning модели каждые 2 месяца) могут сделать проект нерентабельным.

2. Компонент CapEx (капитальные затраты)

CapEx (Capital Expenditure) — единовременные инвестиции в приобретение оборудования и лицензий.

2.1. GPU-серверы

Для локального развёртывания LLM (open-source модель типа Llama 3, Mistral, Qwen) требуются мощные серверы.
Пример: NVIDIA A100 (80GB) — ~$10–15k за штуку, для инференса модели 70B нужно минимум 4 карты.
Цена стоек, охлаждения, сетевого оборудования (InfiniBand).

2.2. Лицензии ПО

Проприетарные векторные БД (Pinecone, Weaviate Cloud) имеют подписку, но некоторые (Milvus, Qdrant) — open-source (только поддержка).
Платформы для мониторинга (Datadog, Grafana) — лицензии.

2.3. Сетевая инфраструктура

Брандмауэры, балансировщики нагрузки (если on-premise).

Формула CapEx

CapEx = (сумма закупок оборудования + лицензии + пуско-наладочные работы)

Обычно амортизируется за 3 года (годовая норма = CapEx / 3).

3. Компонент OpEx (операционные затраты)

OpEx (Operational Expenditure) — регулярные расходы на поддержку работающей системы.

3.1. Облачные ресурсы (IaaS/PaaS)

Compute: GPU-инстансы (AWS p4d, GCP a2-highgpu). Стоимость ~$3–5/час за одну A100.
Storage: векторные индексы, логи, кэш. S3 / GCS / Blob Storage — $0.02–0.05/GB/мес.
Сеть: трафик между регионами и к клиентам.

3.2. API-вызовы

Если используется внешняя LLM (GPT-4, Claude) — входные и выходные токены.
Пример: GPT-4o — $2.5/M input токен, $10/M output токен. При 1M запросов/мес (средняя длина 500+500 токенов) получаем ~$6250/мес.

3.3. Электроэнергия (on-premise)

Для 4 × A100 ~ 2000 Вт, ×24h ×30 дней = 1440 кВт·ч. При тарифе $0.1/кВт·ч = $144/мес.
Охлаждение добавляет 30–50% к затратам на электроэнергию.

3.4. Администрирование и поддержка

Зарплата SRE/DevOps (0.25 FTE) — $50k–80k/год.
Поддержка со стороны вендоров (Enterprise Support для векторной БД) — $10k–50k/год.

Формула OpEx

OpEx(мес) = облачные ресурсы + API + электроэнергия + зарплаты поддержки / 12

Годовая OpEx = OpEx(мес) × 12.

4. Компонент DevEx (затраты на разработку)

DevEx (Development Expenditure) — затраты на создание и развёртывание системы, включая итерации и тестирование.

4.1. Зарплаты команды

ML Engineer (1 FTE) — $150k–200k/год (разработка RAG pipeline, fine-tuning).
Data Engineer (0.5 FTE) — $120k–150k/год (этап индексации и пайплайны данных).
Product Manager (0.2 FTE) — $130k/год (координация требований).

4.2. Этапы разработки

Построение прототипа (1–2 месяца): сбор данных, выбор моделей, baseline.
Интеграция с бизнес-системами (1–3 месяца).
A/B-тестирование, устранение регрессий (1–2 месяца).

4.3. Инструменты и инфраструктура для разработки

Compute для экспериментов: GPU-инстансы для fine-tuning (дополнительный OpEx, но часто классифицируется как DevEx).
Инструменты MLOps (Kubeflow, MLflow, Weights & Biases).

Формула DevEx

DevEx = (зарплаты за период разработки) + (стоимость экспериментов) + (лицензии на Dev-инструменты)

Обычно DevEx фиксируется за первый год, но может повторяться при мажорных обновлениях.

5. Компонент RiskEx (стоимость рисков)

RiskEx (Risk Expenditure) — финансовые последствия от ошибок и неопределённостей.

5.1. Стоимость галлюцинаций (некорректных ответов)

Потеря клиентов, репутационный ущерб, юридические иски.
Оценивается как вероятность галлюцинации × средний ущерб за случай.
Пример: в медицинском RAG-чате галлюцинация с неверным диагнозом может стоить $1M+; в поддержке — потеря LTV клиента ~$500.

5.2. Упущенная выгода

Задержка выхода на рынок из-за неоптимальной архитектуры.
Низкое качество ответов → пользователи уходят к конкурентам.

5.3. Compliance-риски

Нарушение GDPR (штраф до 4% глобального оборота).
Отсутствие объяснимости (AI Act) — невозможность объяснить, почему агент принял решение.

5.4. Риски роста (scale-up)

Внезапный рост трафика → перегрузка GPU, вынужденный апгрейд (дополнительный CapEx или спот-инстансы с переплатой).
Вендор-лок (зависимость от API одной LLM) → при повышении цен или уходе модели.

Формула RiskEx

RiskEx = (вероятность риска × стоимость реализации) × количество сценариев

Обычно RiskEx выражается в годовом ожидаемом убытке (Annual Loss Expectancy). Для RAG/Agent систем RiskEx может составлять 15–30% от суммы CapEx+OpEx+DevEx.

6. Полная формула TCO

TCO(за период, например 3 года) = CapEx + (OpEx × срок в годах) + DevEx + (RiskEx × срок в годах)

Или в годовом выражении:

Annual TCO = (CapEx / 3) + OpEx(год) + (DevEx / срок) + RiskEx(год)

7. Пример расчёта для типового RAG-агента

Условия Частота запросов — 100k/мес, средняя длина запроса + ответа — 500+500 токенов. Модель — GPT-4o (через API). Векторная БД — Pinecone (cloud). Разработка — 3 месяца командой из 3 человек.

Компонент	Статья	Стоимость за 3 года
CapEx	GPU не требуется (облачная LLM)	$0
OpEx	API GPT-4o (100k × 1k токенов × $12.5/M) = $1250/мес × 36	$45 000
OpEx	Pinecone (pod-based, ~$500/мес)	$18 000
OpEx	Cloud compute (обработка документов, кэш) ~$200/мес	$7 200
OpEx	Администрирование (0.25 DevOps × $75k/год)	$56 250
DevEx	3 человека × $180k avg × 0.25 года (3 мес)	$135 000
DevEx	GPU для экспериментов (A100 spot) ~$3k	$3 000
RiskEx	15% от суммы верхних = 0.15 × (45k+18k+7.2k+56.25k+135k+3k) = 0.15 × 264.45k	$39 667
TCO 3 года		~$304 117

Интерпретация за 3 года система обойдётся ~$304k. Это ~$2.53 за запрос (если 100k/мес × 36 = 3.6M запросов). Если бизнес планирует 500k запросов/мес, TCO/запрос снизится за счёт экономии на масштабе (фиксированные DevEx размазываются).

8. Оптимизация TCO: стратегии

Аспект	Вариант	Эффект
LLM	Замена GPT-4o на open-source модель (Local)	CapEx растёт, но OpEx (API) падает до нуля. При большом объёме ( > 1M запросов/мес) локальная модель окупается
Chunking	Уменьшение среднего размера контекста (с 500 до 300 токенов)	OpEx API снижается на 40%
Кэширование	Кэш частых запросов (Redis)	Снижение количества API-вызовов на 30–60%
Agent loops	Ограничение максимального числа итераций агента (с 5 до 3)	Уменьшение токенов на сессию (каждая итерация — дополнительный вызов)
RiskEx	Добавление human-in-the-loop для высокорисковых ответов	Снижение ущерба от галлюцинаций, но увеличивается OpEx (человеческий труд)

9. Инструменты для расчёта TCO

AWS TCO Calculator — для сравнения on-premise vs cloud.
Cloud Cost Management (CloudHealth, Vantage) — мониторинг фактического OpEx.
LLM Cost Calculator (open-source скрипты) — оценка затрат на токены.
Vectara RAG TCO Tool — специализированный калькулятор для RAG.

Для агентных систем важно добавить учёт:

Количество вызовов LLM на сессию (planning, tools, reflection).
Стоимость tool calls (если external API платные).
Стоимость context window (в некоторых провайдерах длинный контекст дороже).

10. Связь TCO с бизнес-метриками

TCO — это не абсолютное число, а метрика для принятия решений. Важно сравнивать Cost per Request (CPR) и Cost per Satisfied User (CPSU).

Метрика	Формула	Интерпретация
Cost per request	TCO / total_requests	Прямая стоимость одного ответа
Cost per token	TCO / total_output_tokens	Эффективность генерации
Cost per active user	TCO / MAU	Удельная стоимость пользователя
ROI = (Benefit – TCO) / TCO	Выгода (повышение retention, продаж)	Оправдана ли система

Пет-проект для закрепления

Задача Разработать дашборд для расчёта TCO RAG-системы с выбором между локальной (VLLM + open-source модель) и облачной (GPT-4o) архитектурой.

Инструменты

Python (Streamlit / Gradio)
YAML-файл конфигурации (параметры: объём запросов, цены на API, стоимость GPU, зарплаты)
Matplotlib / Plotly для графиков

Шаги:

Определить компоненты TCO (CapEx, OpEx, DevEx, RiskEx).
Задать параметры: количество запросов/мес (100k–5M), стоимость GPU (A100 $10k, H100 $30k), зарплаты (3 роли), API prices.
Написать функцию расчета TCO на 1/3/5 лет.
Реализовать слайдеры для параметров и кнопку “Calculate”.
Добавить график “Break-even point” — когда локальная модель становится дешевле облачной.
Вывести таблицу сравнения и рекомендации.

Ожидаемый результат Веб-приложение, которое позволяет менять параметры и видеть TCO, CPR, точку окупаемости. Это можно показать на собеседовании как демонстрацию понимания экономики систем.

Связь с другими вопросами

Вопрос	Тема
775	Как рассчитать ROI RAG-системы?
777	Стратегии кэширования для снижения Cost per Request
778	Сравнение экономики open-source и проприетарных LLM
780	Метрики эффективности использования GPU (GPU utilization, cost per token)
785	Как проектировать Agent loops с учётом бюджета?
790	Cost-aware routing: маршрутизация запросов к дешёвым или дорогим моделям

Краткий тезис

1. Определение TCO и его значение для RAG/Agent систем

Стоимость GPU-серверов, облачных ресурсов, API-вызовов.
Зарплаты ML-инженеров, DevOps, Data Engineers.
Затраты на устранение последствий галлюцинаций и репутационные потери.
Compliance-издержки (GDPR, HIPAA и т.д.).

2. Компонент CapEx (капитальные затраты)

CapEx (Capital Expenditure) — единовременные инвестиции в приобретение оборудования и лицензий.

2.1. GPU-серверы

Для локального развёртывания LLM (open-source модель типа Llama 3, Mistral, Qwen) требуются мощные серверы.
Пример: NVIDIA A100 (80GB) — ~$10–15k за штуку, для инференса модели 70B нужно минимум 4 карты.
Цена стоек, охлаждения, сетевого оборудования (InfiniBand).

2.2. Лицензии ПО

Проприетарные векторные БД (Pinecone, Weaviate Cloud) имеют подписку, но некоторые (Milvus, Qdrant) — open-source (только поддержка).
Платформы для мониторинга (Datadog, Grafana) — лицензии.

2.3. Сетевая инфраструктура

Брандмауэры, балансировщики нагрузки (если on-premise).

Формула CapEx

CapEx = (сумма закупок оборудования + лицензии + пуско-наладочные работы)

Обычно амортизируется за 3 года (годовая норма = CapEx / 3).

3. Компонент OpEx (операционные затраты)

OpEx (Operational Expenditure) — регулярные расходы на поддержку работающей системы.

3.1. Облачные ресурсы (IaaS/PaaS)

Compute: GPU-инстансы (AWS p4d, GCP a2-highgpu). Стоимость ~$3–5/час за одну A100.
Storage: векторные индексы, логи, кэш. S3 / GCS / Blob Storage — $0.02–0.05/GB/мес.
Сеть: трафик между регионами и к клиентам.

3.2. API-вызовы

Если используется внешняя LLM (GPT-4, Claude) — входные и выходные токены.
Пример: GPT-4o — $2.5/M input токен, $10/M output токен. При 1M запросов/мес (средняя длина 500+500 токенов) получаем ~$6250/мес.

3.3. Электроэнергия (on-premise)

Для 4 × A100 ~ 2000 Вт, ×24h ×30 дней = 1440 кВт·ч. При тарифе $0.1/кВт·ч = $144/мес.
Охлаждение добавляет 30–50% к затратам на электроэнергию.

3.4. Администрирование и поддержка

Зарплата SRE/DevOps (0.25 FTE) — $50k–80k/год.
Поддержка со стороны вендоров (Enterprise Support для векторной БД) — $10k–50k/год.

Формула OpEx

OpEx(мес) = облачные ресурсы + API + электроэнергия + зарплаты поддержки / 12

Годовая OpEx = OpEx(мес) × 12.

4. Компонент DevEx (затраты на разработку)

DevEx (Development Expenditure) — затраты на создание и развёртывание системы, включая итерации и тестирование.

4.1. Зарплаты команды

ML Engineer (1 FTE) — $150k–200k/год (разработка RAG pipeline, fine-tuning).
Data Engineer (0.5 FTE) — $120k–150k/год (этап индексации и пайплайны данных).
Product Manager (0.2 FTE) — $130k/год (координация требований).

4.2. Этапы разработки

Построение прототипа (1–2 месяца): сбор данных, выбор моделей, baseline.
Интеграция с бизнес-системами (1–3 месяца).
A/B-тестирование, устранение регрессий (1–2 месяца).

4.3. Инструменты и инфраструктура для разработки

Compute для экспериментов: GPU-инстансы для fine-tuning (дополнительный OpEx, но часто классифицируется как DevEx).
Инструменты MLOps (Kubeflow, MLflow, Weights & Biases).

Формула DevEx

DevEx = (зарплаты за период разработки) + (стоимость экспериментов) + (лицензии на Dev-инструменты)

Обычно DevEx фиксируется за первый год, но может повторяться при мажорных обновлениях.

5. Компонент RiskEx (стоимость рисков)

RiskEx (Risk Expenditure) — финансовые последствия от ошибок и неопределённостей.

5.1. Стоимость галлюцинаций (некорректных ответов)

Потеря клиентов, репутационный ущерб, юридические иски.
Оценивается как вероятность галлюцинации × средний ущерб за случай.
Пример: в медицинском RAG-чате галлюцинация с неверным диагнозом может стоить $1M+; в поддержке — потеря LTV клиента ~$500.

5.2. Упущенная выгода

Задержка выхода на рынок из-за неоптимальной архитектуры.
Низкое качество ответов → пользователи уходят к конкурентам.

5.3. Compliance-риски

Нарушение GDPR (штраф до 4% глобального оборота).
Отсутствие объяснимости (AI Act) — невозможность объяснить, почему агент принял решение.

5.4. Риски роста (scale-up)

Внезапный рост трафика → перегрузка GPU, вынужденный апгрейд (дополнительный CapEx или спот-инстансы с переплатой).
Вендор-лок (зависимость от API одной LLM) → при повышении цен или уходе модели.

Формула RiskEx

RiskEx = (вероятность риска × стоимость реализации) × количество сценариев

6. Полная формула TCO

TCO(за период, например 3 года) = CapEx + (OpEx × срок в годах) + DevEx + (RiskEx × срок в годах)

Или в годовом выражении:

Annual TCO = (CapEx / 3) + OpEx(год) + (DevEx / срок) + RiskEx(год)

7. Пример расчёта для типового RAG-агента

Компонент	Статья	Стоимость за 3 года
CapEx	GPU не требуется (облачная LLM)	$0
OpEx	API GPT-4o (100k × 1k токенов × $12.5/M) = $1250/мес × 36	$45 000
OpEx	Pinecone (pod-based, ~$500/мес)	$18 000
OpEx	Cloud compute (обработка документов, кэш) ~$200/мес	$7 200
OpEx	Администрирование (0.25 DevOps × $75k/год)	$56 250
DevEx	3 человека × $180k avg × 0.25 года (3 мес)	$135 000
DevEx	GPU для экспериментов (A100 spot) ~$3k	$3 000
RiskEx	15% от суммы верхних = 0.15 × (45k+18k+7.2k+56.25k+135k+3k) = 0.15 × 264.45k	$39 667
TCO 3 года		~$304 117

8. Оптимизация TCO: стратегии

Аспект	Вариант	Эффект
LLM	Замена GPT-4o на open-source модель (Local)	CapEx растёт, но OpEx (API) падает до нуля. При большом объёме ( > 1M запросов/мес) локальная модель окупается
Chunking	Уменьшение среднего размера контекста (с 500 до 300 токенов)	OpEx API снижается на 40%
Кэширование	Кэш частых запросов (Redis)	Снижение количества API-вызовов на 30–60%
Agent loops	Ограничение максимального числа итераций агента (с 5 до 3)	Уменьшение токенов на сессию (каждая итерация — дополнительный вызов)
RiskEx	Добавление human-in-the-loop для высокорисковых ответов	Снижение ущерба от галлюцинаций, но увеличивается OpEx (человеческий труд)

9. Инструменты для расчёта TCO

AWS TCO Calculator — для сравнения on-premise vs cloud.
Cloud Cost Management (CloudHealth, Vantage) — мониторинг фактического OpEx.
LLM Cost Calculator (open-source скрипты) — оценка затрат на токены.
Vectara RAG TCO Tool — специализированный калькулятор для RAG.

Для агентных систем важно добавить учёт:

Количество вызовов LLM на сессию (planning, tools, reflection).
Стоимость tool calls (если external API платные).
Стоимость context window (в некоторых провайдерах длинный контекст дороже).

10. Связь TCO с бизнес-метриками

Метрика	Формула	Интерпретация
Cost per request	TCO / total_requests	Прямая стоимость одного ответа
Cost per token	TCO / total_output_tokens	Эффективность генерации
Cost per active user	TCO / MAU	Удельная стоимость пользователя
ROI = (Benefit – TCO) / TCO	Выгода (повышение retention, продаж)	Оправдана ли система

Пет-проект для закрепления

Инструменты

Python (Streamlit / Gradio)
YAML-файл конфигурации (параметры: объём запросов, цены на API, стоимость GPU, зарплаты)
Matplotlib / Plotly для графиков

Шаги:

Определить компоненты TCO (CapEx, OpEx, DevEx, RiskEx).
Задать параметры: количество запросов/мес (100k–5M), стоимость GPU (A100 $10k, H100 $30k), зарплаты (3 роли), API prices.
Написать функцию расчета TCO на 1/3/5 лет.
Реализовать слайдеры для параметров и кнопку “Calculate”.
Добавить график “Break-even point” — когда локальная модель становится дешевле облачной.
Вывести таблицу сравнения и рекомендации.

Связь с другими вопросами

Вопрос	Тема
775	Как рассчитать ROI RAG-системы?
777	Стратегии кэширования для снижения Cost per Request
778	Сравнение экономики open-source и проприетарных LLM
780	Метрики эффективности использования GPU (GPU utilization, cost per token)
785	Как проектировать Agent loops с учётом бюджета?
790	Cost-aware routing: маршрутизация запросов к дешёвым или дорогим моделям

Как считать TCO (Total Cost of Ownership) для RAG/Agent системы?

Краткий тезис

1. Определение TCO и его значение для RAG/Agent систем

2. Компонент CapEx (капитальные затраты)

2.1. GPU-серверы

2.2. Лицензии ПО

2.3. Сетевая инфраструктура

3. Компонент OpEx (операционные затраты)

3.1. Облачные ресурсы (IaaS/PaaS)

3.2. API-вызовы

3.3. Электроэнергия (on-premise)

3.4. Администрирование и поддержка

4. Компонент DevEx (затраты на разработку)

4.1. Зарплаты команды

4.2. Этапы разработки

4.3. Инструменты и инфраструктура для разработки

5. Компонент RiskEx (стоимость рисков)

5.1. Стоимость галлюцинаций (некорректных ответов)

5.2. Упущенная выгода

5.3. Compliance-риски

5.4. Риски роста (scale-up)

6. Полная формула TCO

7. Пример расчёта для типового RAG-агента

8. Оптимизация TCO: стратегии

9. Инструменты для расчёта TCO

10. Связь TCO с бизнес-метриками

Пет-проект для закрепления

Связь с другими вопросами

Навигация

Как считать TCO (Total Cost of Ownership) для RAG/Agent системы?

Краткий тезис

1. Определение TCO и его значение для RAG/Agent систем

2. Компонент CapEx (капитальные затраты)

2.1. GPU-серверы

2.2. Лицензии ПО

2.3. Сетевая инфраструктура

3. Компонент OpEx (операционные затраты)

3.1. Облачные ресурсы (IaaS/PaaS)

3.2. API-вызовы

3.3. Электроэнергия (on-premise)

3.4. Администрирование и поддержка

4. Компонент DevEx (затраты на разработку)

4.1. Зарплаты команды

4.2. Этапы разработки

4.3. Инструменты и инфраструктура для разработки

5. Компонент RiskEx (стоимость рисков)

5.1. Стоимость галлюцинаций (некорректных ответов)

5.2. Упущенная выгода

5.3. Compliance-риски

5.4. Риски роста (scale-up)

6. Полная формула TCO

7. Пример расчёта для типового RAG-агента

8. Оптимизация TCO: стратегии

9. Инструменты для расчёта TCO

10. Связь TCO с бизнес-метриками

Пет-проект для закрепления

Связь с другими вопросами

Навигация