Stanza
Stanza
Определение
Stanza — это библиотека для обработки естественного языка на Python, разработанная Stanford NLP Group. Она предоставляет точный морфологический анализ, включая определение частей речи, лемматизацию и синтаксический разбор, что позволяет эффективно отсеивать стоп-слова с учётом их грамматической роли.
Где встречается
- 907. Объясните задачу Coreference Resolution. Зачем она нужна в RAG-системах для работы с длинными документами?
- 921. Как вы очищаете текст от шума (HTML-теги, спецсимволы, стоп-слова) в production RAG-пайплайне?