termTimeoutSeconds
termTimeoutSeconds
Определение
Параметр Kubernetes (terminationGracePeriodSeconds), задающий максимальное время на graceful shutdown пода. Для LLM serving его увеличивают, чтобы успеть завершить текущие запросы и корректно остановить модель.