中文翻译暂不可用,显示俄语原文。

autoscaling inference

autoscaling inference

Определение

Автоматическое добавление или удаление реплик LLM на основе текущей нагрузки для эффективного использования ресурсов и баланса между стоимостью и SLA.

Где встречается

Навигация