中文翻译暂不可用,显示俄语原文。
FullyShardedDataParallel
FullyShardedDataParallel
Определение
Класс PyTorch для распределённого обучения, который шардирует параметры, градиенты и состояния оптимизатора между устройствами, снижая потребление памяти.
中文翻译暂不可用,显示俄语原文。
Класс PyTorch для распределённого обучения, который шардирует параметры, градиенты и состояния оптимизатора между устройствами, снижая потребление памяти.