Russian-stop-words
Russian-stop-words
Определение
Набор часто встречающихся слов русского языка (предлоги, союзы, местоимения, частицы), которые обычно не несут значимой смысловой нагрузки и фильтруются при предобработке текстов. В NLP стоп-листы, например из библиотеки nltk, используются для удаления таких токенов, однако анализ внимания модели (attention) к этим словам может указывать на переобучение.