RuParus
RuParus
Определение
RuParus — русскоязычный датасет, предназначенный для оценки семантической близости пар предложений. Он содержит пары предложений с экспертными оценками схожести, что позволяет сравнивать качество различных моделей эмбеддингов, включая статичные (например, Word2Vec, fastText) и контекстуальные (например, BERT). Датасет используется для бенчмаркинга и анализа эффективности методов векторного представления текста на русском языке.