中文翻译暂不可用,显示俄语原文。
StoryBench
StoryBench
Определение
Бенчмарк для оценки сюжетной креативности моделей, использующий LLM-as-a-judge для автоматической оценки качества сгенерированных историй.
中文翻译暂不可用,显示俄语原文。
Бенчмарк для оценки сюжетной креативности моделей, использующий LLM-as-a-judge для автоматической оценки качества сгенерированных историй.