StoryBench
StoryBench
Определение
Бенчмарк для оценки сюжетной креативности моделей, использующий LLM-as-a-judge для автоматической оценки качества сгенерированных историй.
Бенчмарк для оценки сюжетной креативности моделей, использующий LLM-as-a-judge для автоматической оценки качества сгенерированных историй.