中文翻译暂不可用,显示俄语原文。

RULER

RULER

Определение

Бенчмарк для оценки long-context способностей модели, включающий задачи multi-needle, variable tracking и common word extraction.

Где встречается

Навигация