ToolBench

ToolBench

Определение

ToolBench — это бенчмарк для оценки способности больших языковых моделей выполнять вызов функций (function calling). Он включает набор задач, в которых модель должна правильно выбирать и вызывать внешние инструменты (tools) на основе запроса пользователя. Разработан для тестирования и сравнения моделей в сценариях tool use.

Где встречается

Навигация