Fair share
Fair share
Определение
Политика распределения ресурсов, гарантирующая каждому арендатору (tenant) минимальную долю вычислительных мощностей (например, GPU) при справедливом планировании.
Где встречается
- 826. Как организовать GPU scheduling для multi-tenant LLM serving
- 800+ вопросов
- 205. Настроить GPU scheduling для multi-tenant