TfidfVectorizer

TfidfVectorizer

Определение

TfidfVectorizer — инструмент библиотеки scikit-learn для преобразования коллекции текстовых документов в матрицу признаков TF-IDF. Он вычисляет частоту термина (TF) и обратную частоту документа (IDF) для каждого токена, создавая разреженное представление, подчеркивающее важность слов в документе относительно всего корпуса. Обычно применяется в задачах классификации текстов в пайплайне с линейными моделями, такими как LogisticRegression.

Где встречается

Навигация