Distributed Data Parallel

Определение

Метод распределённого обучения с полной копией модели на каждом GPU и синхронизацией градиентов через AllReduce.