тестирование агентов
тестирование агентов
Определение
Процесс количественной и качественной оценки поведения AI-агента в контролируемых сценариях, включающий проверку корректности шагов, целостности траектории и робастности.
Где встречается
- 176. Какие инструменты для агентской эвалюации вы используете
- 567. Что такое plannerexecutor architecture для агентов и когда она нужна
- 880. Как проектировать golden dataset для agent evaluation
- Практика
- 800+ вопросов
- 151. Настроить trajectory coverage