multi-tenant
multi-tenant
Определение
Архитектура, при которой одна инстанция ПО обслуживает несколько логических клиентов (тенантов). Каждому тенанту может выделяться гарантированная доля ресурсов, например, при многопользовательском инференсе.
Где встречается
- 123. Как вы защищаете RAG-систему от утечки данных между клиентами (multi-tenant isolation)
- 207. Как работает scheduler в vLLM Какие алгоритмы выбора запросов
- 447. Как работает scheduler в vLLM Какие алгоритмы выбора запросов
- 850. Как работают inference schedulers (FCFS, Priority, Fairness)
- Практика
- 800+ вопросов
- 205. Настроить GPU scheduling для multi-tenant
- 219. Сравнить inference schedulers (FCFS vs Priority)