Поиск

  • wikiInference scheduler

    # Inference scheduler ## Определение Планировщик запросов к модели, определяет порядок обслуживания, типы: FCFS, Priority, Fairness. ## Где встречается - [[850. Как работают inference…

  • wikiBatching scheduler

    # Batching scheduler ## Определение Планировщик, который группирует входящие запросы в батчи для оптимальной загрузки GPU и повышения пропускной способности. ## Где встречается…

  • wikimulti-tenant

    …Как работает scheduler в vLLM Какие алгоритмы выбора запросов|207. Как работает scheduler в vLLM Какие алгоритмы выбора запросов]] - [[447…

  • wikiStarvation

    …Как работает scheduler в vLLM Какие алгоритмы выбора запросов|207. Как работает scheduler в vLLM Какие алгоритмы выбора запросов]] - [[447…

  • wikikube-scheduler

    # kube-scheduler ## Определение Компонент Kubernetes, отвечающий за размещение подов на узлах кластера с учётом топологии, ресурсов и политик. ## Где встречается…

  • wikiWarp schedulers

    # Warp schedulers ## Определение Компоненты SM, управляющие выполнением warps; в H100 имеется 4 warp schedulers на SM. ## Где встречается - [[705. Как…

  • answerКак работает scheduler в vLLM? Какие алгоритмы выбора запросов?

    …Как работает scheduler в vLLM? Какие алгоритмы выбора запросов? ## Краткий тезис [[Вики/Planner\|Scheduler]] в [[Вики/VLLM\|vLLM]] — это центральный…

  • wikipriority-based scheduling

    …Как работает scheduler в vLLM Какие алгоритмы выбора запросов|207. Как работает scheduler в vLLM Какие алгоритмы выбора запросов]] - [[447…

  • wikiCosine Scheduler

    # Cosine Scheduler ## Определение Планировщик скорости обучения, изменяющий learning rate по косинусному закону с warmup. Обеспечивает плавное снижение темпа, улучшая сходимость…

  • wikicustom scheduler

    # custom scheduler ## Определение Пользовательский планировщик Kubernetes, реализующий topology-aware scheduling для оптимизации размещения подов. ## Где встречается - [[10. Реализовать topology-aware…

  • wikipreemption

    …Как работает scheduler в vLLM Какие алгоритмы выбора запросов|207. Как работает scheduler в vLLM Какие алгоритмы выбора запросов]] - [[210…

  • wikischeduler extender

    # scheduler extender ## Определение Расширение планировщика Kubernetes в виде HTTP-сервиса, проверяющего запросы GPU и топологию узлов. ## Где встречается - [[10. Реализовать…

  • wikiblock

    …Как работает scheduler в vLLM Какие алгоритмы выбора запросов|207. Как работает scheduler в vLLM Какие алгоритмы выбора запросов]] - [[447…

  • wikiWarp scheduler

    # Warp scheduler ## Определение Аппаратный блок на Streaming Multiprocessor (SM) GPU, который выбирает, какой warp выполнять в данный момент, и переключается…

  • wikitoken-level scheduler

    # token-level scheduler ## Определение Компонент инференс-системы (например, TGI), который на каждой итерации выбирает, какие токены из активных запросов будут…

  • wikiPoisson arrival

    # Poisson arrival ## Определение Статистическая модель поступления запросов с экспоненциальным распределением интервалов, используемая в симуляциях для тестирования планировщиков (scheduler). ## Где встречается…

  • wikiScheduler policy

    # Scheduler policy ## Определение Правила, определяющие, какие запросы из waiting queue добавлять в running queue (например, first-come-first-served). Используется…

  • wikiburst

    …Как работают inference schedulers (FCFS, Priority, Fairness)|850. Как работают inference schedulers (FCFS, Priority, Fairness)]] - [[219. Сравнить inference schedulers (FCFS…

  • wikiDeficit round robin

    # Deficit round robin ## Определение Алгоритм справедливой очереди с дефицитом, используемый в inference schedulers для честного распределения ресурсов между запросами. Позволяет…

  • wikiPlanner

    # Planner ## Определение Компонент, который генерирует план действий (например, в архитектуре агента) или управляет очередью запросов (например, scheduler в vLLM). ## Где…

  • wikiWaiting queue

    # Waiting queue ## Определение Очередь запросов, ожидающих начала обработки, из которой scheduler берёт новые запросы для выполнения. ## Где встречается - [[438. Что…

  • answerКак работает scheduler в vLLM? Какие алгоритмы выбора запросов?

    …возможное [[Вики/Starvation\|голодание]] низкоприоритетных запросов; требуется механизм назначения приоритетов. ### 4.3 Fairness (справедливость) [[Вики/Inference scheduler\|Scheduler]] стремится равномерно…

  • wikifairness scheduling

    …Как работает scheduler в vLLM Какие алгоритмы выбора запросов|207. Как работает scheduler в vLLM Какие алгоритмы выбора запросов]] - [[447…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать data locality scheduler

    …Реализовать data locality scheduler ## 1. Цель задачи Разработать прототип планировщика (scheduler) для распределённой вычислительной системы, который размещает задачи на узлах…

  • wikirecomputation

    …Как работает scheduler в vLLM Какие алгоритмы выбора запросов|207. Как работает scheduler в vLLM Какие алгоритмы выбора запросов]] - [[304…

  • answerКак работают inference schedulers (FCFS, Priority, Fairness)?

    …Что такое inference scheduler и зачем он нужен [[Вики/Inference scheduler\|Inference scheduler]] ([[Вики/Planner\|планировщик]] инференса]]) — программный [[Вики/Module…

  • wikiAging

    …Как работают inference schedulers (FCFS, Priority, Fairness)|850. Как работают inference schedulers (FCFS, Priority, Fairness)]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiConvoy effect

    …Как работают inference schedulers (FCFS, Priority, Fairness)|850. Как работают inference schedulers (FCFS, Priority, Fairness)]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiLatency-sensitive

    …Как работают inference schedulers (FCFS, Priority, Fairness)|850. Как работают inference schedulers (FCFS, Priority, Fairness)]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiSwap

    …Как работает scheduler в vLLM Какие алгоритмы выбора запросов|207. Как работает scheduler в vLLM Какие алгоритмы выбора запросов]] - [[232…

  • wikiArrival time

    …Как работает scheduler в vLLM Какие алгоритмы выбора запросов|447. Как работает scheduler в vLLM Какие алгоритмы выбора запросов]] ## Навигация…

  • wikisequence

    …Как работает scheduler в vLLM Какие алгоритмы выбора запросов|207. Как работает scheduler в vLLM Какие алгоритмы выбора запросов]] ## Навигация…

  • wikihybrid scheduling

    …Как работает scheduler в vLLM Какие алгоритмы выбора запросов|207. Как работает scheduler в vLLM Какие алгоритмы выбора запросов]] ## Навигация…

  • wikiPreemption by recomputation

    …Как работают inference schedulers (FCFS, Priority, Fairness)|850. Как работают inference schedulers (FCFS, Priority, Fairness)]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiboxplot

    …Сравнить inference schedulers (FCFS vs Priority)|219. Сравнить inference schedulers (FCFS vs Priority)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikiLIFO-эвристика

    …Как работают inference schedulers (FCFS, Priority, Fairness)|850. Как работают inference schedulers (FCFS, Priority, Fairness)]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiSwapped queue

    …Как работает scheduler в vLLM Какие алгоритмы выбора запросов|447. Как работает scheduler в vLLM Какие алгоритмы выбора запросов]] ## Навигация…

  • wikiPreemption by swap

    …Как работают inference schedulers (FCFS, Priority, Fairness)|850. Как работают inference schedulers (FCFS, Priority, Fairness)]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiCDF

    …Сравнить inference schedulers (FCFS vs Priority)|219. Сравнить inference schedulers (FCFS vs Priority)]] - [[224. vLLM кластер на 4 GPU|224…

  • wikiPriority ceiling

    …Как работают inference schedulers (FCFS, Priority, Fairness)|850. Как работают inference schedulers (FCFS, Priority, Fairness)]] - [[293. Настроить conflict resolution между…

  • wikiDrop rate

    …Сравнить inference schedulers (FCFS vs Priority)|219. Сравнить inference schedulers (FCFS vs Priority)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikiRunning queue

    …Как работает scheduler в vLLM Какие алгоритмы выбора запросов|447. Как работает scheduler в vLLM Какие алгоритмы выбора запросов]] ## Навигация…

  • wikipriority queuing

    …Сравнить inference schedulers (FCFS vs Priority)|219. Сравнить inference schedulers (FCFS vs Priority)]] - [[292. Реализовать distributed task queue для агентов…

  • wikiPriority

    …Как работает scheduler в vLLM Какие алгоритмы выбора запросов|447. Как работает scheduler в vLLM Какие алгоритмы выбора запросов]] - [[453…

  • wikiasyncio.Queue

    …Сравнить inference schedulers (FCFS vs Priority)|219. Сравнить inference schedulers (FCFS vs Priority)]] - [[294. Реализовать leader election для агентов|294…

  • wikiFirst-come-first-serve

    …Как работает scheduler в vLLM Какие алгоритмы выбора запросов|447. Как работает scheduler в vLLM Какие алгоритмы выбора запросов]] - [[Практика…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Сравнить inference schedulers (FCFS vs Priority)

    …Сравнить inference schedulers (FCFS vs Priority) ## 1. Цель задачи Научиться проектировать и сравнивать два подхода к планированию инференса в многотенантной…

  • wikiBlock manager

    …Как работает scheduler в vLLM Какие алгоритмы выбора запросов|447. Как работает scheduler в vLLM Какие алгоритмы выбора запросов]] - [[837…

  • answerКак работает continuous batching в TGI (Hugging Face Text Generation Inference)?

    …Термин «[[Вики/token-level scheduler\|токен-уровневый scheduler]]» ([[Вики/token-level scheduler\|token-level scheduler]]) — компонент, который на каждой итерации…

  • answerКак работает warp scheduling на NVIDIA GPU и как это влияет на LLM kernels?

    …Из них физически исполняться может только ограниченное число (зависит от числа schedulers и [[Вики/пайплайн\|pipeline]]). ### 1.3 Warp scheduler