ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить auto-scaling с учётом cost

1. Цель задачи

Научиться проектировать и настраивать систему автоматического масштабирования (auto-scaling) для микросервисов, которая минимизирует затраты на облачные ресурсы при сохранении надёжности (reliability) на уровне 99%. В рамках задачи необходимо реализовать гибридную стратегию: критически важные (онлайн) сервисы размещать на on-demand инстансах, а фоновые пакетные (batch) нагрузки — на spot/preemptible инстансах. В результате ожидается снижение совокупной стоимости инфраструктуры на 40% по сравнению с исходной (all on-demand) без превышения целевого порога ошибок.

Ключевой результат Конфигурация HPA (Horizontal Pod Autoscaler) и Cluster Autoscaler (или Karpenter) в Kubernetes-кластере, с метриками cost и reliability, подтверждающими 40% экономию при сохранении 99% успешных запросов.

2. Исходные данные

Перед началом необходимо иметь:

Что нужно	Откуда взять
Рабочий Kubernetes-кластер (версия ≥ 1.24)	Облачный провайдер (AWS EKS / GKE / AKS) или локальный (minikube / kind с симуляцией spot)
Приложение с двумя профилями: критический (online) и batch	Существующий микросервис или тестовое приложение (например, `simple-webapp` + `job-queue`)
Метрики использования CPU/Memory за последние 2 недели	Prometheus + kube-state-metrics или экспорт из облака
Аккаунт с правами на создание инстансов (on-demand и spot)	Личный / рабочий аккаунт AWS / GCP / Azure
Инструмент мониторинга cost (рекомендуется)	Kubecost, CloudHealth, или собственные скрипты с облачными API

Если нет реального облака с поддержкой spot — симулируем:

Развернуть локальный кластер с minikube или kind
Создать две группы нод (label: instance-type=on-demand и instance-type=spot) с разными ценами в симуляции (например, стоимость spot = 30% от on-demand)
Написать скрипт на Python, который эмулирует eviction spot-ноды (удаление пода) и фиксирует время перезапуска
Использовать metrics-server или custom Prometheus exporter для метрик

3. Технологический стек

Компонент	Инструменты	Назначение
Оркестрация контейнеров	Kubernetes (Amazon EKS / GKE / AKS / локальный)	Размещение сервисов и управление ресурсами
Auto-scaling (поды)	HPA + custom metrics (или KEDA)	Масштабирование подов по нагрузке
Auto-scaling (ноды)	Cluster Autoscaler / Karpenter	Добавление/удаление узлов с учётом типа инстанса
Мониторинг	Prometheus + Grafana + kube-state-metrics	Сбор метрик CPU, memory, request rate, cost
Cost-аналитика	Kubecost / OpenCost / облачные отчёты	Агрегация затрат по типу инстанса и сервису
Инструменты развёртывания	Helm / Kustomize / Argo CD	Управление конфигурациями

4. Этапы выполнения

Этап 1: Анализ текущего ландшафта и определение baseline (1–2 часа)

Действия

Инвентаризация сервисов
- Разделить все микросервисы на два класса:
  - Критические (on‑demand): сервисы с требованиями к низкой задержке, без возможности перезапуска (фронт, API‑шлюз, пользовательские сессии).
  - Batch: фоновые задачи, ETL, обработка очередей, обучение моделей, которые могут быть прерваны и перезапущены позже.
Замерить baseline стоимости
- Рассчитать текущие затраты за последние 30 дней: C_base = sum(price_per_instance_type * runtime_hours)
- Определить текущую reliability: % успешных запросов (2xx) от общего трафика, исключая planned maintenance.
- Если нет исторических данных — запустить нагрузочное тестирование на all on-demand в течение 2 часов и зафиксировать метрики.
Установить целевые показатели
- Target cost: C_target = C_base * 0.6
- Target reliability: ≥ 99%

Ожидаемый результат этапа
Документ с классификацией сервисов, текущими затратами и целевыми показателями. В репозитории — baseline.yml (файл с метриками).

Этап 2: Конфигурация spot-инстансов и taints/tolerations (2–3 часа)

Действия

Создать nodeGroup / nodePool для spot-инстансов

AWS: eksctl -> managedNodeGroup с spot: true
GKE: node pool с spot (preemptible VMs)
Локальная симуляция: добавить две tainted ноды (instance-type=spot:NoSchedule)

# Пример для GKE (terraform)
resource "google_container_node_pool" "spot" {
  name       = "spot-pool"
  node_count = 2
  node_config {
    preemptible = true
    machine_type = "e2-standard-4"
    labels = {
      "instance-type" = "spot"
    }
    taint {
      key    = "instance-type"
      value  = "spot"
      effect = "NO_SCHEDULE"
    }
  }
}

Настроить tolerations для batch-сервисов
- Каждый batch‑deployment получает toleration instance-type=spot:NoSchedule и nodeSelector instance-type: spot.
Настроить Pod Disruption Budget (PDB) для batch-сервисов
- maxUnavailable: 50% — чтобы при eviction ноды не падала вся обработка.

Ожидаемый результат этапа
Spot-ноды запущены, batch-сервисы успешно запускаются на них, on‑demand сервисы остаются на обычных нодах.

Этап 3: Настройка автоскейлинга подов (HPA + KEDA) (2–3 часа)

Действия

Установить metrics-server и Prometheus Adapter
- Убедиться, что HPA может читать кастомные метрики (например, requests-per-second).
Создать HPA для критического сервиса (on‑demand)
- Метрика: средняя загрузка CPU (target 70%) + дополнительно request latency P99.
- Поведение: стабильное (scale-up быстрее, scale-down медленнее).
- minReplicas: 2, maxReplicas: 20.
Создать KEDA ScaledObject для batch-сервиса
- Использовать очередь (RabbitMQ / Kafka / AWS SQS) как триггер масштабирования.
- cooldownPeriod: 120 секунд — чтобы избежать флаппинга при eviction.
- Параметр fallback — при недоступности очереди использовать minReplicas.
```
apiVersion: keda.sh/v1alpha1
kind: ScaledObject
metadata:
  name: batch-worker
spec:
  scaleTargetRef:
    name: batch-deployment
  triggers:
  - type: prometheus
    metadata:
      serverAddress: http://prometheus.svc:9090
      metricName: queue_depth
      query: sum(queue_size)
      threshold: '10'
```
Настроить HorizontalPodAutoscaler для batch (опционально)
- Если KEDA не используется — кастомный HPA с метрикой из очереди через Prometheus Adapter.

Ожидаемый результат этапа
Поды batch автоматически масштабируются под длину очереди, поды online — под CPU/латенси. Все поды правильно распределены по нодам.

Этап 4: Настройка автоскейлинга нод (Cluster Autoscaler / Karpenter) (2–3 часа)

Действия

Установить Cluster Autoscaler (CA)
- Настроить --balance-similar-node-groups для равномерного использования on‑demand и spot.
- Задать --max-nodes-per-group = 20 для spot, 10 для on‑demand.
Настроить overprovisioning (buffer)
- Создать PriorityClass для low‑priority пойлов, которые будут вытесняться первыми при нехватке ресурсов.
- Развернуть дополнительную «медленную» ноду с Cluster Proportional Autoscaler для ускорения scale‑up.

Настроить Karpenter (опционально, более гибкий)

Provisioner с двумя requirements:
- critical → karpenter.sh/capacity-type: on-demand
- batch → karpenter.sh/capacity-type: spot

apiVersion: karpenter.sh/v1alpha5
kind: Provisioner
metadata:
  name: default
spec:
  requirements:
    - key: karpenter.sh/capacity-type
      operator: In
      values: ["on-demand", "spot"]   # оба типа
  limits:
    resources:
      cpu: 1000
  provider:
    instanceProfile: karpenter-node
  taints:
    - key: instance-type
      value: spot
      effect: NoSchedule

Проверить graceful shutdown batch-подов при eviction
- Добавить preStop хук и terminationGracePeriodSeconds: 30.

Ожидаемый результат этапа
Cluster Autoscaler (или Karpenter) добавляет/удаляет ноды в зависимости от нагрузки. Spot-ноды могут быть прерваны без потери данных — batch-поды переезжают.

Этап 5: Сбор метрик cost, reliability и оптимизация (3–4 часа)

Действия

Установить Kubecost / OpenCost
- Связать с облачным биллингом (AWS CUR, GCP Billing Export).
- Настроить алерты на превышение бюджета.
Запустить нагрузочное тестирование
- Использовать locust или k6 для симуляции смешанной нагрузки (70% online, 30% batch).
- Длительность: 4–6 часов (включая 1 час пик).
- Фиксировать метрики cost (Kubecost), reliability (Grafana % 2xx).
Рассчитать фактическую экономию
- savings = (C_base - C_new) / C_base * 100%
- Если savings < 40% → увеличить долю batch-нагрузки на spot или уменьшить minReplicas on‑demand.
Проверить reliability
- reliability = (total_requests - error_requests) / total_requests * 100%
- Если ниже 99% → увеличить PDB, добавить fallback реплик, настроить предварительный warm-up.

Ожидаемый результат этапа
Отчёт с графиками: стоимость по часам, количество eviction, latency, количество реплик. Подтверждение достижения цели.

5. Критерии приемки (Definition of Done)

6. Ожидаемый результат

Основной артефакт Репозиторий с конфигурациями Kubernetes (YAML/Helm) и скриптами для развёртывания.

cost-scaling/
- hpa-critical.yaml
- keda-batch.yaml
- cluster-autoscaler-values.yaml
- node-pools.yaml (terraform или eksctl)
- pdb-batch.yaml
monitoring/
- grafana-dashboard-cost-reliability.json
- prometheus-rules.yaml
testing/
- locustfile.py
- baseline-cost-export.csv

Содержание отчёта

График стоимости: week over week, разбивка on‑demand / spot.
График reliability (P99 latency, error budget).
Таблица с показателями «до» и «после».

Дополнительно (опционально):

Pull-request с изменениями в production-конфиги.
Runbook по обработке eviction batch-подов.

7. Возможные сложности и их решение

Сложность	Решение
Spot-ноды часто прерываются → перекос нагрузки	Настроить `interruption-handler` (AWS Node Termination Handler), увеличить PDB, использовать `topologySpreadConstraints`
Scale‑up нод слишком медленный → растёт латенси	Добавить `overprovisioning` с low‑priority подами, использовать `Cluster Autoscaler` с `--scale-up-cpu-threshold=0.8`
Flapping HPA при резком изменении очереди	Увеличить `stabilizationWindowSeconds` до 120, включить `behavior` с `scaleDown` slower
Стоимость spot оказалась не намного ниже on‑demand (регион)	Проверить цены в других AZ, рассмотреть reserved instances для baseline, а spot только для burst
Трудность в расчёте реальной экономии	Использовать Kubecost с allocation by label (`instance-type`), включить `idle cost`
Batch-сервисы не успевают завершить обработку до eviction	Уменьшить `terminationGracePeriodSeconds`, внедрить чекпоинты и возобновление задач

8. Бюджет времени (оценка)

Этап	Время
Анализ и baseline	1–2 ч
Конфигурация spot-инстансов + taints	2–3 ч
Настройка автоскейлинга подов (HPA/KEDA)	2–3 ч
Настройка автоскейлинга нод (CA/Karpenter)	2–3 ч
Тестирование, мониторинг, оптимизация	3–4 ч
Документация	1 ч
Итого	12–16 ч

Примечание При первом выполнении задачи добавьте 30% буфера на отладку и неожиданные проблемы с облачными квотами.

9. Связанные вопросы из базы знаний

Вопрос	Тема
112	Настройка HPA с кастомными метриками
134	Spot Instances: best practices
201	Cluster Autoscaler vs Karpenter
307	KEDA: масштабирование по очереди
412	Cost allocation в Kubernetes с Kubecost
503	Graceful shutdown и Pod Disruption Budget
678	Нагрузочное тестирование с Locust
709	Мониторинг reliability и SLO
814	Reserved Instances vs Spot vs On‑demand
890	Taints, tolerations и nodeSelector

10. Чек-лист самопроверки

ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить auto-scaling с учётом cost

1. Цель задачи

2. Исходные данные

Перед началом необходимо иметь:

Что нужно	Откуда взять
Рабочий Kubernetes-кластер (версия ≥ 1.24)	Облачный провайдер (AWS EKS / GKE / AKS) или локальный (minikube / kind с симуляцией spot)
Приложение с двумя профилями: критический (online) и batch	Существующий микросервис или тестовое приложение (например, `simple-webapp` + `job-queue`)
Метрики использования CPU/Memory за последние 2 недели	Prometheus + kube-state-metrics или экспорт из облака
Аккаунт с правами на создание инстансов (on-demand и spot)	Личный / рабочий аккаунт AWS / GCP / Azure
Инструмент мониторинга cost (рекомендуется)	Kubecost, CloudHealth, или собственные скрипты с облачными API

Если нет реального облака с поддержкой spot — симулируем:

Развернуть локальный кластер с minikube или kind
Создать две группы нод (label: instance-type=on-demand и instance-type=spot) с разными ценами в симуляции (например, стоимость spot = 30% от on-demand)
Написать скрипт на Python, который эмулирует eviction spot-ноды (удаление пода) и фиксирует время перезапуска
Использовать metrics-server или custom Prometheus exporter для метрик

3. Технологический стек

Компонент	Инструменты	Назначение
Оркестрация контейнеров	Kubernetes (Amazon EKS / GKE / AKS / локальный)	Размещение сервисов и управление ресурсами
Auto-scaling (поды)	HPA + custom metrics (или KEDA)	Масштабирование подов по нагрузке
Auto-scaling (ноды)	Cluster Autoscaler / Karpenter	Добавление/удаление узлов с учётом типа инстанса
Мониторинг	Prometheus + Grafana + kube-state-metrics	Сбор метрик CPU, memory, request rate, cost
Cost-аналитика	Kubecost / OpenCost / облачные отчёты	Агрегация затрат по типу инстанса и сервису
Инструменты развёртывания	Helm / Kustomize / Argo CD	Управление конфигурациями

4. Этапы выполнения

Этап 1: Анализ текущего ландшафта и определение baseline (1–2 часа)

Действия

Инвентаризация сервисов
- Разделить все микросервисы на два класса:
  - Критические (on‑demand): сервисы с требованиями к низкой задержке, без возможности перезапуска (фронт, API‑шлюз, пользовательские сессии).
  - Batch: фоновые задачи, ETL, обработка очередей, обучение моделей, которые могут быть прерваны и перезапущены позже.
Замерить baseline стоимости
- Рассчитать текущие затраты за последние 30 дней: C_base = sum(price_per_instance_type * runtime_hours)
- Определить текущую reliability: % успешных запросов (2xx) от общего трафика, исключая planned maintenance.
- Если нет исторических данных — запустить нагрузочное тестирование на all on-demand в течение 2 часов и зафиксировать метрики.
Установить целевые показатели
- Target cost: C_target = C_base * 0.6
- Target reliability: ≥ 99%

Этап 2: Конфигурация spot-инстансов и taints/tolerations (2–3 часа)

Действия

Создать nodeGroup / nodePool для spot-инстансов

AWS: eksctl -> managedNodeGroup с spot: true
GKE: node pool с spot (preemptible VMs)
Локальная симуляция: добавить две tainted ноды (instance-type=spot:NoSchedule)

# Пример для GKE (terraform)
resource "google_container_node_pool" "spot" {
  name       = "spot-pool"
  node_count = 2
  node_config {
    preemptible = true
    machine_type = "e2-standard-4"
    labels = {
      "instance-type" = "spot"
    }
    taint {
      key    = "instance-type"
      value  = "spot"
      effect = "NO_SCHEDULE"
    }
  }
}

Настроить tolerations для batch-сервисов
- Каждый batch‑deployment получает toleration instance-type=spot:NoSchedule и nodeSelector instance-type: spot.
Настроить Pod Disruption Budget (PDB) для batch-сервисов
- maxUnavailable: 50% — чтобы при eviction ноды не падала вся обработка.

Этап 3: Настройка автоскейлинга подов (HPA + KEDA) (2–3 часа)

Действия

Установить metrics-server и Prometheus Adapter
- Убедиться, что HPA может читать кастомные метрики (например, requests-per-second).
Создать HPA для критического сервиса (on‑demand)
- Метрика: средняя загрузка CPU (target 70%) + дополнительно request latency P99.
- Поведение: стабильное (scale-up быстрее, scale-down медленнее).
- minReplicas: 2, maxReplicas: 20.
Создать KEDA ScaledObject для batch-сервиса
- Использовать очередь (RabbitMQ / Kafka / AWS SQS) как триггер масштабирования.
- cooldownPeriod: 120 секунд — чтобы избежать флаппинга при eviction.
- Параметр fallback — при недоступности очереди использовать minReplicas.
```
apiVersion: keda.sh/v1alpha1
kind: ScaledObject
metadata:
  name: batch-worker
spec:
  scaleTargetRef:
    name: batch-deployment
  triggers:
  - type: prometheus
    metadata:
      serverAddress: http://prometheus.svc:9090
      metricName: queue_depth
      query: sum(queue_size)
      threshold: '10'
```
Настроить HorizontalPodAutoscaler для batch (опционально)
- Если KEDA не используется — кастомный HPA с метрикой из очереди через Prometheus Adapter.

Этап 4: Настройка автоскейлинга нод (Cluster Autoscaler / Karpenter) (2–3 часа)

Действия

Установить Cluster Autoscaler (CA)
- Настроить --balance-similar-node-groups для равномерного использования on‑demand и spot.
- Задать --max-nodes-per-group = 20 для spot, 10 для on‑demand.
Настроить overprovisioning (buffer)
- Создать PriorityClass для low‑priority пойлов, которые будут вытесняться первыми при нехватке ресурсов.
- Развернуть дополнительную «медленную» ноду с Cluster Proportional Autoscaler для ускорения scale‑up.

Настроить Karpenter (опционально, более гибкий)

Provisioner с двумя requirements:
- critical → karpenter.sh/capacity-type: on-demand
- batch → karpenter.sh/capacity-type: spot

apiVersion: karpenter.sh/v1alpha5
kind: Provisioner
metadata:
  name: default
spec:
  requirements:
    - key: karpenter.sh/capacity-type
      operator: In
      values: ["on-demand", "spot"]   # оба типа
  limits:
    resources:
      cpu: 1000
  provider:
    instanceProfile: karpenter-node
  taints:
    - key: instance-type
      value: spot
      effect: NoSchedule

Проверить graceful shutdown batch-подов при eviction
- Добавить preStop хук и terminationGracePeriodSeconds: 30.

Этап 5: Сбор метрик cost, reliability и оптимизация (3–4 часа)

Действия

Установить Kubecost / OpenCost
- Связать с облачным биллингом (AWS CUR, GCP Billing Export).
- Настроить алерты на превышение бюджета.
Запустить нагрузочное тестирование
- Использовать locust или k6 для симуляции смешанной нагрузки (70% online, 30% batch).
- Длительность: 4–6 часов (включая 1 час пик).
- Фиксировать метрики cost (Kubecost), reliability (Grafana % 2xx).
Рассчитать фактическую экономию
- savings = (C_base - C_new) / C_base * 100%
- Если savings < 40% → увеличить долю batch-нагрузки на spot или уменьшить minReplicas on‑demand.
Проверить reliability
- reliability = (total_requests - error_requests) / total_requests * 100%
- Если ниже 99% → увеличить PDB, добавить fallback реплик, настроить предварительный warm-up.

5. Критерии приемки (Definition of Done)

6. Ожидаемый результат

Основной артефакт Репозиторий с конфигурациями Kubernetes (YAML/Helm) и скриптами для развёртывания.

cost-scaling/
- hpa-critical.yaml
- keda-batch.yaml
- cluster-autoscaler-values.yaml
- node-pools.yaml (terraform или eksctl)
- pdb-batch.yaml
monitoring/
- grafana-dashboard-cost-reliability.json
- prometheus-rules.yaml
testing/
- locustfile.py
- baseline-cost-export.csv

Содержание отчёта

График стоимости: week over week, разбивка on‑demand / spot.
График reliability (P99 latency, error budget).
Таблица с показателями «до» и «после».

Дополнительно (опционально):

Pull-request с изменениями в production-конфиги.
Runbook по обработке eviction batch-подов.

7. Возможные сложности и их решение

Сложность	Решение
Spot-ноды часто прерываются → перекос нагрузки	Настроить `interruption-handler` (AWS Node Termination Handler), увеличить PDB, использовать `topologySpreadConstraints`
Scale‑up нод слишком медленный → растёт латенси	Добавить `overprovisioning` с low‑priority подами, использовать `Cluster Autoscaler` с `--scale-up-cpu-threshold=0.8`
Flapping HPA при резком изменении очереди	Увеличить `stabilizationWindowSeconds` до 120, включить `behavior` с `scaleDown` slower
Стоимость spot оказалась не намного ниже on‑demand (регион)	Проверить цены в других AZ, рассмотреть reserved instances для baseline, а spot только для burst
Трудность в расчёте реальной экономии	Использовать Kubecost с allocation by label (`instance-type`), включить `idle cost`
Batch-сервисы не успевают завершить обработку до eviction	Уменьшить `terminationGracePeriodSeconds`, внедрить чекпоинты и возобновление задач

8. Бюджет времени (оценка)

Этап	Время
Анализ и baseline	1–2 ч
Конфигурация spot-инстансов + taints	2–3 ч
Настройка автоскейлинга подов (HPA/KEDA)	2–3 ч
Настройка автоскейлинга нод (CA/Karpenter)	2–3 ч
Тестирование, мониторинг, оптимизация	3–4 ч
Документация	1 ч
Итого	12–16 ч

9. Связанные вопросы из базы знаний

Вопрос	Тема
112	Настройка HPA с кастомными метриками
134	Spot Instances: best practices
201	Cluster Autoscaler vs Karpenter
307	KEDA: масштабирование по очереди
412	Cost allocation в Kubernetes с Kubecost
503	Graceful shutdown и Pod Disruption Budget
678	Нагрузочное тестирование с Locust
709	Мониторинг reliability и SLO
814	Reserved Instances vs Spot vs On‑demand
890	Taints, tolerations и nodeSelector