Min-max fairness
Min-max fairness
Определение
Политика распределения ресурсов, гарантирующая каждому арендатору минимальный объём, а избыток распределяющая пропорционально. Используется в GPU scheduling для multi-tenant LLM serving.
Политика распределения ресурсов, гарантирующая каждому арендатору минимальный объём, а избыток распределяющая пропорционально. Используется в GPU scheduling для multi-tenant LLM serving.