Поиск

wikiGPU scheduling
# GPU scheduling ## Определение Механизм распределения вычислительных ресурсов GPU между задачами или арендаторами (tenant'ами) в multi-tenant окружении. Обеспечивает справедливое…
wikitopology-aware scheduling
# topology-aware scheduling ## Определение Подход к планированию задач в Kubernetes, учитывающий топологию сети (например, домены NVSwitch) для оптимизации размещения tensor…
wikiGang scheduling
# Gang scheduling ## Определение Метод, при котором группа задач (например, распределённый инференс) запускается одновременно; поддерживается Kueue и Volcano. ## Где встречается - [[826…
wikinode selector
# node selector ## Определение Механизм привязки подов к узлам по меткам; в контексте GPU scheduling позволяет назначать конкретные устройства, например MIG…
wikipriority-based scheduling
# priority-based scheduling ## Определение Алгоритм планирования выполнения запросов, при котором запросы с более высоким приоритетом (например, от премиум-пользователей) обрабатываются…
wikiVolcano
# Volcano ## Определение Планировщик пакетных заданий для Kubernetes с поддержкой GPU scheduling, gang scheduling и fair-share; альтернатива Kueue для программного…
wikiKueue
# Kueue ## Определение Нативный планировщик Kubernetes с поддержкой очередей, fair share, preemption и gang scheduling; используется для распределения ресурсов (включая GPU…
wikiLearning Rate Scheduling
# Learning Rate Scheduling ## Определение Процесс динамического изменения learning rate в ходе обучения; включает методы вроде cosine annealing и warmup, улучшающие…
wikiFair share
…Как организовать GPU scheduling для multi-tenant LLM serving|826. Как организовать GPU scheduling для multi-tenant LLM serving]] - [[800…
wikiKubernetes device plugin
…Как организовать GPU scheduling для multi-tenant LLM serving|826. Как организовать GPU scheduling для multi-tenant LLM serving]] - [[Практика…
wikiListAndWatch
# ListAndWatch ## Определение Метод, используемый для модификации объявлений устройств в контексте topology-aware scheduling. ## Где встречается - [[10. Реализовать topology-aware scheduling…
wikicustom scheduler
# custom scheduler ## Определение Пользовательский планировщик Kubernetes, реализующий topology-aware scheduling для оптимизации размещения подов. ## Где встречается - [[10. Реализовать topology-aware…
wikiDCGM
…Как организовать GPU scheduling для multi-tenant LLM serving]] - [[205. Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling…
wikiiteration-level scheduling
# iteration-level scheduling ## Определение Механизм планирования на уровне итераций, лежащий в основе continuous batching в vLLM. Позволяет управлять батчем на…
wikiLimitRange
# LimitRange ## Определение Объект Kubernetes для ограничения ресурсов в namespace, используемый при настройке GPU scheduling для multi-tenant (MIG). ## Где встречается…
wikiLocalQueue
# LocalQueue ## Определение LocalQueue — очередь задач в Kubernetes, используемая для подачи задач в каждом namespace, например в системе GPU scheduling. ## Где…
wikihybrid scheduling
# hybrid scheduling ## Определение Комбинация приоритетного и справедливого планирования запросов к LLM для баланса между соблюдением SLA и равномерностью обслуживания. ## Где…
wikiWarp scheduling
# Warp scheduling ## Определение Механизм GPU, при котором при простое одного warp (ожидание памяти) происходит переключение на другой warp для скрытия…
wikioff-peak scheduling
# off-peak scheduling ## Определение Стратегия планирования batch-инференса на периоды с низкой стоимостью GPU, позволяющая снизить затраты. ## Где встречается - [[220…
wikiBinpacking
…Применяется при организации GPU scheduling для мультитенантного обслуживания LLM. ## Где встречается - [[826. Как организовать GPU scheduling для multi-tenant LLM…
wikiDCGM_FI_DEV_NVLINK_BANDWIDTH_TOTAL
…Помогает выявить узкие места при распределённых вычислениях, например, при topology-aware scheduling. ## Где встречается - [[10. Реализовать topology-aware scheduling|10…
wikiMin-max fairness
…Используется в GPU scheduling для multi-tenant LLM serving. ## Где встречается - [[826. Как организовать GPU scheduling для multi-tenant LLM…
wikiMulti-tenant LLM serving
…Включает планирование запросов (scheduling) с учётом SLA каждого тенанта. ## Где встречается - [[826. Как организовать GPU scheduling для multi-tenant LLM…
wikiKind
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] - [[74. Настроить auto-scaling для vLLM|74. Настроить auto-scaling для…
wikifairness scheduling
# fairness scheduling ## Определение Алгоритм планирования запросов, гарантирующий каждому tenant минимальную долю ресурсов (fair share) и предотвращающий голодание. ## Где встречается - [[176…
wikiAllocate
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
wikinvbandwidth
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
wikiGo
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
wikiClusterRole
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
wikikubetest
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
wikiMSCCL
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
wikischeduler extender
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
wikigpu-exporter
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
wikilabel selector
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
wikiClusterQueue
…Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling для multi-tenant]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiextended resource
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
wikikube-scheduler
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
wikinode affinity
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
wikicuda_memtest
…Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling для multi-tenant]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiGPU-экспортёр
…Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling для multi-tenant]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikibatch/v1 Job
…Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling для multi-tenant]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiResourceFlavor
…Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling для multi-tenant]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikipreemption
…Как организовать GPU scheduling для multi-tenant LLM serving|826. Как организовать GPU scheduling для multi-tenant LLM serving]] - [[837…
wikifake device plugin
…Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling для multi-tenant]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiResourceQuota
…Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling для multi-tenant]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikiGini coefficient
…Как организовать GPU scheduling для multi-tenant LLM serving|826. Как организовать GPU scheduling для multi-tenant LLM serving]] ## Навигация…
wikiHierarchical resource quotas
…Как организовать GPU scheduling для multi-tenant LLM serving|826. Как организовать GPU scheduling для multi-tenant LLM serving]] ## Навигация…
wikiInterleaved 1F1B
# Interleaved 1F1B ## Определение Улучшенная схема pipeline parallelism, при которой каждая стадия обрабатывает несколько последовательных фрагментов, уменьшая pipeline bubbles. ## Где встречается…
wikiMulti-Instance GPU
…Настроить GPU scheduling для multi-tenant|205. Настроить GPU scheduling для multi-tenant]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
wikinvidia-container-toolkit
…Реализовать topology-aware scheduling|10. Реализовать topology-aware scheduling]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…