N-gram language models

N-gram language models

Определение

N-граммные языковые модели — это вероятностные модели, которые предсказывают следующее слово в последовательности на основе фиксированного количества предыдущих слов (N-1). Они оценивают вероятность последовательности слов, используя частоты N-грамм (подпоследовательностей из N слов) из обучающего корпуса. Например, в 5-граммной модели вероятность слова зависит от четырех предшествующих слов, а значение Perplexity (PPL) 100 на новостном корпусе считается посредственным.

Где встречается

Навигация