Good-Turing
Good-Turing
Определение
Good-Turing — это метод сглаживания (smoothing) для оценки вероятностей n-грамм в языковых моделях, который корректирует оценки максимального правдоподобия для редких событий, перераспределяя вероятность от наблюдаемых n-грамм к ненаблюдаемым. Он основан на идее, что частота появления n-грамм с определённой частотой может быть использована для оценки вероятности n-грамм, которые встречаются реже или не встречаются вовсе. Метод был предложен Аланом Тьюрингом и его ассистентом Ирвингом Гудом.