first-order optimization
first-order optimization
Определение
Метод оптимизации, использующий градиенты (производные первого порядка) для поиска минимума функции. В контексте LLM применяется для оптимизации в пространстве токенов на этапе инференса, например, в ∇-Reasoner.
Где встречается
- 153. Что такое ∇-Reasoner (nabla-reasoner) и как он использует градиентный спуск на этапе теста
- 800+ вопросов