Adam optimizer

Adam optimizer

Определение

Адаптивный алгоритм оптимизации, использующий оценки первого и второго моментов градиентов (mean и variance). Широко применяется для обучения LLM благодаря эффективной работе с зашумленными градиентами и способности находить плоские минимумы.

Где встречается

Навигация