3D parallelism

3D parallelism

Определение

Комбинация трёх уровней параллелизма (data, tensor, pipeline) для распределённого обучения больших моделей (100B+ параметров). Стандартный подход для масштабирования на тысячи GPU.

Где встречается

Навигация