Out-of-vocabulary (OOV)
Out-of-vocabulary (OOV)
Определение
Out-of-vocabulary (OOV) — это термин, обозначающий слова, которые отсутствуют в словаре предварительно обученной модели (например, эмбеддингов слов). Такие слова не могут быть напрямую сопоставлены с вектором, если модель не учитывает их внутреннюю структуру. Word2Vec и другие модели на основе целых слов неспособны обрабатывать OOV-слова, тогда как FastText, используя n-граммы символов, может генерировать векторы даже для неизвестных слов.