Лемматизация
Лемматизация
Определение
Лемматизация — это процесс приведения слова к его нормальной (словарной) форме — лемме, с учетом морфологии и части речи. В отличие от стемминга, который просто отсекает окончания, лемматизация использует словарь и грамматические правила, что делает результат более точным. Это помогает уменьшить размер словаря в NLP-задачах, объединяя разные словоформы в одну лемму.
Где встречается
- 901. Что такое pymorphy2 и Natasha? В чем разница между морфологическим анализом и си
- 902. Объясните разницу между стеммингом и лемматизацией
- 926. Что такое Sparse Vector vs Dense Vector в контексте NLP