ToolBench
ToolBench
Определение
ToolBench — это бенчмарк для оценки способности больших языковых моделей выполнять вызов функций (function calling). Он включает набор задач, в которых модель должна правильно выбирать и вызывать внешние инструменты (tools) на основе запроса пользователя. Разработан для тестирования и сравнения моделей в сценариях tool use.