FSDP

FSDP

Определение

Техника распределённого обучения в PyTorch, которая шардирует веса, градиенты и состояния оптимизатора между GPU, уменьшая потребление памяти и позволяя обучать большие модели.

Где встречается

Навигация