ZeroSCROLLS
ZeroSCROLLS
Определение
Бенчмарк для оценки способности модели понимать длинные документы (книги, научные статьи). Включает задачи извлечения информации, ответов на вопросы и реферирования.
Бенчмарк для оценки способности модели понимать длинные документы (книги, научные статьи). Включает задачи извлечения информации, ответов на вопросы и реферирования.