N-gram language models
N-gram language models
Определение
N-граммные языковые модели — это вероятностные модели, которые предсказывают следующее слово в последовательности на основе фиксированного количества предыдущих слов (N-1). Они оценивают вероятность последовательности слов, используя частоты N-грамм (подпоследовательностей из N слов) из обучающего корпуса. Например, в 5-граммной модели вероятность слова зависит от четырех предшествующих слов, а значение Perplexity (PPL) 100 на новостном корпусе считается посредственным.