Стемминг-коллизия
Стемминг-коллизия
Определение
Стемминг-коллизия — это ситуация, когда стеммер (алгоритм выделения основы слова) приводит разные по смыслу словоформы к одной основе, что вызывает ложные срабатывания в информационном поиске. Например, запрос «печь» может выдать документы как про глагол «печь» (готовить пищу), так и про существительное «печь» (нагревательное устройство), поскольку стем не различает грамматические категории. Это делает коллизии типичной проблемой стемминга в задачах поиска и классификации текстов.