English translation is not available yet. Showing Russian content.
StoryBench
StoryBench
Определение
Бенчмарк для оценки сюжетной креативности моделей, использующий LLM-as-a-judge для автоматической оценки качества сгенерированных историй.
English translation is not available yet. Showing Russian content.
Бенчмарк для оценки сюжетной креативности моделей, использующий LLM-as-a-judge для автоматической оценки качества сгенерированных историй.