ServiceMonitor
ServiceMonitor
Определение
Ресурс Prometheus Operator для настройки сбора метрик с сервисов, например, с GPU-экспортёра или LLM-сервера.
Где встречается
- 72. Настроить capacity planning для GPU кластера
- 74. Настроить auto-scaling для vLLM
- 192. Настроить autoscaling для LLM сервера
- 205. Настроить GPU scheduling для multi-tenant