SLA
SLA
Определение
Соглашение об уровне обслуживания, определяющее целевые показатели производительности сервиса: латентность, доступность, качество, rate limits. Включает SLO и условия компенсации при нарушениях.
Где встречается
- 207. Как работает scheduler в vLLM Какие алгоритмы выбора запросов
- 216. Как вы делаете load testing для LLM endpoint Какие метрики ключевые
- 220. Как вы выбираете между online и batch инференсом для LLM
- 249. Как вы делаете load shedding при перегрузке LLM сервера
- 381. Как вы определяете SLO и SLA для LLM сервиса
- 390. Как вы проектируем on-call ротацию для AI сервиса
- 416. Как вы делаете load shedding при перегрузке LLM сервера
- 756. Как выглядит process operational excellence в Harness Engineering (ORR, Operational Reviews)
- 760. Что такое Delegation Engineering и чем он отличается от Harness Engineering
- 763. Как проектировать fallback-цепи (агент А → агент Б → человек)
- 767. Как проектировать SLA между агентом-менеджером и агентами-исполнителями
- 783. Как сравнивать cost efficiency разных LLM провайдеров
- 815. Что такое «dead letter queue» для сообщений агентов
- 825. Что такое autoscaling inference и как его настроить
- 850. Как работают inference schedulers (FCFS, Priority, Fairness)
- 863. Как проектировать Airflow DAG для RAG ingestion
- 864. Как обрабатывать late-arriving data в ingestion
- Практика
- 800+ вопросов
- 124. Настроить SLA между агентами
- 143. Сравнить reserved vs spot vs on-demand
- 238. RAG с incremental update
- 263. Реализовать автоматический postmortem