Поиск
- wikiGPU scheduling
# GPU scheduling ## Определение Механизм распределения вычислительных ресурсов GPU между задачами или арендаторами (tenant'ами) в multi-tenant окружении. Обеспечивает справедливое…
- wikitopology-aware scheduling
# topology-aware scheduling ## Определение Подход к планированию задач в Kubernetes, учитывающий топологию сети (например, домены NVSwitch) для оптимизации размещения tensor…
- wikiGang scheduling
# Gang scheduling ## Определение Метод, при котором группа задач (например, распределённый инференс) запускается одновременно; поддерживается Kueue и Volcano. ## Где встречается - [[826…
- wikinode selector
# node selector ## Определение Механизм привязки подов к узлам по меткам; в контексте GPU scheduling позволяет назначать конкретные устройства, например MIG…
- wikipriority-based scheduling
# priority-based scheduling ## Определение Алгоритм планирования выполнения запросов, при котором запросы с более высоким приоритетом (например, от премиум-пользователей) обрабатываются…
- wikiVolcano
# Volcano ## Определение Планировщик пакетных заданий для Kubernetes с поддержкой GPU scheduling, gang scheduling и fair-share; альтернатива Kueue для программного…
- wikiKueue
# Kueue ## Определение Нативный планировщик Kubernetes с поддержкой очередей, fair share, preemption и gang scheduling; используется для распределения ресурсов (включая GPU…
- wikiLearning Rate Scheduling
# Learning Rate Scheduling ## Определение Процесс динамического изменения learning rate в ходе обучения; включает методы вроде cosine annealing и warmup, улучшающие…
- wikiFair share
…Как организовать GPU scheduling для multi-tenant LLM serving|826. Как организовать GPU scheduling для multi-tenant LLM serving]] - [[800…
- wikiKubernetes device plugin
…Как организовать GPU scheduling для multi-tenant LLM serving|826. Как организовать GPU scheduling для multi-tenant LLM serving]] - [[Практика…
- wikiListAndWatch
# ListAndWatch ## Определение Метод, используемый для модификации объявлений устройств в контексте topology-aware scheduling. ## Где встречается - [[10. Реализовать topology-aware scheduling…
- wikicustom scheduler
# custom scheduler ## Определение Пользовательский планировщик Kubernetes, реализующий topology-aware scheduling для оптимизации размещения подов. ## Где встречается - [[10. Реализовать topology-aware…
- wikiDCGM
…Как организовать GPU scheduling для multi-tenant LLM serving]] - [[205. Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling…
- wikiiteration-level scheduling
# iteration-level scheduling ## Определение Механизм планирования на уровне итераций, лежащий в основе continuous batching в vLLM. Позволяет управлять батчем на…
- wikiLimitRange
# LimitRange ## Определение Объект Kubernetes для ограничения ресурсов в namespace, используемый при настройке GPU scheduling для multi-tenant (MIG). ## Где встречается…
- wikiLocalQueue
# LocalQueue ## Определение LocalQueue — очередь задач в Kubernetes, используемая для подачи задач в каждом namespace, например в системе GPU scheduling. ## Где…
- wikihybrid scheduling
# hybrid scheduling ## Определение Комбинация приоритетного и справедливого планирования запросов к LLM для баланса между соблюдением SLA и равномерностью обслуживания. ## Где…
- wikiWarp scheduling
# Warp scheduling ## Определение Механизм GPU, при котором при простое одного warp (ожидание памяти) происходит переключение на другой warp для скрытия…
- wikioff-peak scheduling
# off-peak scheduling ## Определение Стратегия планирования batch-инференса на периоды с низкой стоимостью GPU, позволяющая снизить затраты. ## Где встречается - [[220…
- wikiBinpacking
…Применяется при организации GPU scheduling для мультитенантного обслуживания LLM. ## Где встречается - [[826. Как организовать GPU scheduling для multi-tenant LLM…
- wikiDCGM_FI_DEV_NVLINK_BANDWIDTH_TOTAL
…Помогает выявить узкие места при распределённых вычислениях, например, при topology-aware scheduling. ## Где встречается - [[10. Реализовать topology-aware scheduling|10…
- wikiMin-max fairness
…Используется в GPU scheduling для multi-tenant LLM serving. ## Где встречается - [[826. Как организовать GPU scheduling для multi-tenant LLM…
- wikiMulti-tenant LLM serving
…Включает планирование запросов (scheduling) с учётом SLA каждого тенанта. ## Где встречается - [[826. Как организовать GPU scheduling для multi-tenant LLM…
- wikiKind
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] - [[74. Настроить auto-scaling для vLLM|74. Настроить auto-scaling для…
- wikifairness scheduling
# fairness scheduling ## Определение Алгоритм планирования запросов, гарантирующий каждому tenant минимальную долю ресурсов (fair share) и предотвращающий голодание. ## Где встречается - [[176…
- wikiAllocate
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikinvbandwidth
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikiGo
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikiClusterRole
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikikubetest
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikiMSCCL
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikischeduler extender
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikigpu-exporter
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikilabel selector
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikiClusterQueue
…Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling для multi-tenant]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiextended resource
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikikube-scheduler
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikinode affinity
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikicuda_memtest
…Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling для multi-tenant]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiGPU-экспортёр
…Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling для multi-tenant]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikibatch/v1 Job
…Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling для multi-tenant]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiResourceFlavor
…Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling для multi-tenant]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikipreemption
…Как организовать GPU scheduling для multi-tenant LLM serving|826. Как организовать GPU scheduling для multi-tenant LLM serving]] - [[837…
- wikifake device plugin
…Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling для multi-tenant]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiResourceQuota
…Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling для multi-tenant]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiGini coefficient
…Как организовать GPU scheduling для multi-tenant LLM serving|826. Как организовать GPU scheduling для multi-tenant LLM serving]] ## Навигация…
- wikiHierarchical resource quotas
…Как организовать GPU scheduling для multi-tenant LLM serving|826. Как организовать GPU scheduling для multi-tenant LLM serving]] ## Навигация…
- wikiInterleaved 1F1B
# Interleaved 1F1B ## Определение Улучшенная схема pipeline parallelism, при которой каждая стадия обрабатывает несколько последовательных фрагментов, уменьшая pipeline bubbles. ## Где встречается…
- wikiMulti-Instance GPU
…Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling для multi-tenant]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikinvidia-container-toolkit
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…