Service
Service
Определение
Объект Kubernetes, предоставляющий стабильный сетевой доступ к группе подов, например, к LLM-серверу внутри кластера. Обеспечивает балансировку нагрузки и абстракцию от изменений IP-адресов подов.
Где встречается
- 825. Что такое autoscaling inference и как его настроить
- 192. Настроить autoscaling для LLM сервера
- 202. Настроить health checks для LLM