Tool Call Accuracy
Tool Call Accuracy
Определение
Метрика правильности выбора инструмента агентом, включая корректность аргументов; влияет на успешность выполнения задачи.
Где встречается
- 192. Как вы оцениваете качество language representation для задачи
- 383. Что такое error budget для AI качества и как его считать
- 395. Как вы тестируете агента на «неожиданные input» (не только adversarial, но и просто странные)
- 578. Что такое agent evaluation метрика successful task completion rate vs step efficiency
- 786. Что такое «golden dataset» для агента и как его создавать