Поиск

  • wiki3D parallelism

    # 3D parallelism ## Определение Комбинация трёх уровней параллелизма (data, tensor, pipeline) для распределённого обучения больших моделей (100B+ параметров). Стандартный подход для…

  • wikipipeline bubbles

    Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…

  • wikisequence parallelism

    Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…

  • wikimicrobatches

    # microbatches ## Определение Разбиение батча на мелкие части для конвейерной обработки, уменьшающее простои (bubbles) в pipeline parallelism. ## Где встречается - [[203. Tensor

  • wikiModel parallelism

    # Model parallelism ## Определение Общая стратегия распараллеливания модели, включающая Tensor Parallelism и Pipeline Parallelism. ## Где встречается - [[203. Tensor parallelism vs pipeline…

  • wikiMegatron-LM

    # Megatron-LM ## Определение Megatron-LM — фреймворк от NVIDIA для распределённого обучения больших языковых моделей, реализующий 3D parallelism (data, tensor, pipeline…

  • wikiHidden dimension

    Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…

  • wikiAllReduce

    # AllReduce ## Определение Коллективная операция синхронизации и агрегации (суммирования) данных между несколькими GPU, критичная для параллельных вычислений, таких как tensor parallelism

  • wiki1F1B

    Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…

  • wikiRow-wise

    # Row-wise ## Определение Способ разрезания матрицы весов по строкам при tensor parallelism для распределения вычислений между устройствами. ## Где встречается - [[401…

  • wikiColumn-wise

    # Column-wise ## Определение Способ разрезания матрицы весов по столбцам при реализации tensor parallelism, используемый как в инференсе, так и в…

  • wikiPoint-to-point communication

    Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…

  • wikiNVLink

    Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…

  • wikiDeepSpeed Inference

    # DeepSpeed Inference ## Определение Компонент DeepSpeed для автоматического выбора tensor/pipeline parallelism на основе профилирования для ускорения инференса. ## Где встречается - [[203…

  • wikiTensor parallelism

    # Tensor parallelism ## Определение Стратегия распределения модели, при которой веса слоёв разрезаются между GPU, а attention heads распределяются. Требует частых коммуникаций…

  • wikiCompute/communication ratio

    …Когда tensor parallelism хуже pipeline parallelism|840. Когда tensor parallelism хуже pipeline parallelism]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…

  • wikiAllGather

    Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…

  • wikiGPipe

    Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…

  • wikiPipeline parallelism

    Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…

  • wikiData parallelism

    Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…

  • wikiPCIe

    …Когда tensor parallelism хуже pipeline parallelism|840. Когда tensor parallelism хуже pipeline parallelism]] - [[800+ вопросов|800+ вопросов]] - [[1. Развернуть NCCL…

  • wikiNVLink Switch System

    Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…

  • wikiZeRO

    …Когда tensor parallelism хуже pipeline parallelism|840. Когда tensor parallelism хуже pipeline parallelism]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…

  • wikiFP16

    Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…

  • wikiexpert parallelism

    …Что такое 3D parallelism (data + tensor + pipeline)|426. Что такое 3D parallelism (data + tensor + pipeline)]] - [[849. Что такое expert parallelism

  • wikiHorovod

    # Horovod ## Определение Фреймворк для распределенного обучения, поддерживающий только data parallelism. ## Где встречается - [[426. Что такое 3D parallelism (data + tensor + pipeline…

  • wikiChimera

    …Что такое 3D parallelism (data + tensor + pipeline)|426. Что такое 3D parallelism (data + tensor + pipeline)]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiNCCL

    …Как работает tensor parallelism для LLM инференса В чем отличие от pipeline parallelism|401. Как работает tensor parallelism для LLM…

  • wikiColossal-AI

    …Что такое 3D parallelism (data + tensor + pipeline)|426. Что такое 3D parallelism (data + tensor + pipeline)]] ## Навигация - [[00. Индекс терминов|Индекс…

  • answerЧто такое NCCL и почему он критичен для multi-GPU инференса?

    Tensor Parallelism и AllReduce Рассмотрим, как работает [[Вики/Tensor parallelism\|tensor parallelism]] на примере линейного слоя `y = xW`. Если веса…

  • wikiRing all-reduce

    …Когда tensor parallelism хуже pipeline parallelism|840. Когда tensor parallelism хуже pipeline parallelism]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • answerЧто такое NCCL и зачем он для tensor parallelism?

    Tensor Parallelism (тензорный параллелизм) **[[Вики/Tensor parallelism\|Tensor Parallelism]] (TP)** — способ распределения модели, при котором один слой (например, [[Вики/Linear…

  • wiki1F1B with interleaving

    …Что такое 3D parallelism (data + tensor + pipeline)|426. Что такое 3D parallelism (data + tensor + pipeline)]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiLinear layers

    …Как работает tensor parallelism с FP8 в vLLM|460. Как работает tensor parallelism с FP8 в vLLM]] ## Навигация - [[00. Индекс…

  • wikiDTensor

    …Что такое 3D parallelism (data + tensor + pipeline)|426. Что такое 3D parallelism (data + tensor + pipeline)]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiwarp-level parallelism

    # warp-level parallelism ## Определение Метод параллелизма на уровне варпов, используемый в инструкциях WGMMA для эффективного использования Tensor Cores. ## Где встречается…

  • wikinvtop

    …Как работает tensor parallelism для LLM training Чем отличается от инференса|423. Как работает tensor parallelism для LLM training Чем…

  • answerЧто такое 3D parallelism (data + tensor + pipeline)?

    Tensor Parallelism (TP) **[[Вики/Tensor parallelism\|Tensor parallelism]]** (внутрислойный [[Вики/parallelism\|параллелизм]]) — [[Вики/decoupling\|разделение]] вычислений одного слоя, например, матричного…

  • wikicProfile

    …Как работает tensor parallelism для LLM training Чем отличается от инференса|423. Как работает tensor parallelism для LLM training Чем…

  • wikigradient synchronization

    …Как работает tensor parallelism для LLM training Чем отличается от инференса|423. Как работает tensor parallelism для LLM training Чем…

  • wiki4D-параллелизм

    # 4D-параллелизм ## Определение Комбинация data, tensor, pipeline и expert parallelism для масштабирования крупных MoE-моделей (например, Mixtral). ## Где встречается - [[849…

  • wikiA100

    …Когда tensor parallelism хуже pipeline parallelism|840. Когда tensor parallelism хуже pipeline parallelism]] - [[844. Как работает FlashAttention-3 математически|844…

  • answerКак работает sequence parallelism в контексте LLM?

    …Сравнение с другими видами параллелизма | Параметр | Sequence Parallelism | Tensor Parallelism | Pipeline Parallelism | Data Parallelism | |----------|----------------------|--------------------|----------------------|------------------| | Ось разрезания | Длина последовательности | Скрытая размерность…

  • wikitensor-parallel-size

    # tensor-parallel-size ## Определение Параметр vLLM, определяющий количество GPU для распределения модели с помощью tensor parallelism. Влияет на масштабирование и…

  • answerКак работает tensor parallelism для LLM training? Чем отличается от инференса?

    …Что такое Tensor Parallelism (TP) **parallelism|Tensor Parallelism** — это стратегия model parallelism (распараллеливания модели), при которой веса одного слоя (например…

  • answerКак работает tensor parallelism для LLM инференса? В чем отличие от pipeline parallelism?

    …Как работает tensor parallelism для LLM инференса? В чем отличие от pipeline parallelism? ## Краткий тезис **parallelism|Tensor parallelism (TP)** разрезает…

  • wikiscaling factors

    …Как работает tensor parallelism с FP8 в vLLM|460. Как работает tensor parallelism с FP8 в vLLM]] - [[800+ вопросов|800…

  • answerКак PCIe bottleneck проявляется в multi-GPU инференсе?

    …Это делает [[Вики/PCIe\|PCIe]] непригодным для [[Вики/Tensor parallelism\|tensor parallelism]] на больших моделях. --- ## 4. Tensor parallelism и коммуникационные…

  • wikiGPU

    Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…

  • wikiforward pass

    Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…