中文翻译暂不可用,显示俄语原文。
autoscaling inference
autoscaling inference
Определение
Автоматическое добавление или удаление реплик LLM на основе текущей нагрузки для эффективного использования ресурсов и баланса между стоимостью и SLA.
中文翻译暂不可用,显示俄语原文。
Автоматическое добавление или удаление реплик LLM на основе текущей нагрузки для эффективного использования ресурсов и баланса между стоимостью и SLA.