Micro-batch
Micro-batch
Определение
Micro-batch — это минимальная порция данных, на которую разбивается один шаг обучения при использовании метода накопления градиентов (gradient accumulation). Вместо одновременной обработки всего батча (batch) модель последовательно обрабатывает несколько микро-батчей, суммируя их градиенты, и только затем обновляет веса. Это позволяет обучать модели с эффективным размером батча, превышающим объём доступной памяти GPU.