c-TF-IDF

c-TF-IDF

Определение

c-TF-IDF (class-based TF-IDF) — это модификация классической метрики TF-IDF, адаптированная для работы с тематическими кластерами или классами документов. Вместо оценки значимости слова для отдельного документа, c-TF-IDF вычисляет его важность для целого класса, объединяя все документы внутри класса и сравнивая с объединёнными документами других классов. Это позволяет выделить наиболее релевантные слова, характерные для каждой темы, и широко применяется в тематическом моделировании, в частности в алгоритме BERTopic.

Где встречается

Навигация