Let's Verify Step by Step
Let's Verify Step by Step
Определение
Let's Verify Step by Step — это исследование OpenAI (2023), в котором предлагается использовать Process Reward Model (PRM) для оценки правильности каждого шага решения математических задач. Работа демонстрирует, что PRM превосходит Outcome Reward Model (ORM) на бенчмарках MATH и GSM8K на 10–20% по точности при одинаковом объёме данных.
Где встречается
Навигация