AllReduce

AllReduce

Определение

Коллективная операция синхронизации и агрегации (суммирования) данных между несколькими GPU, критичная для параллельных вычислений, таких как tensor parallelism. Используется для объединения градиентов или логитов в распределённом обучении и инференсе.

Где встречается

Навигация