Матрица совместной встречаемости
Матрица совместной встречаемости
Определение
Матрица совместной встречаемости (co-occurrence matrix) — это квадратная матрица размером V × V, где V — количество уникальных слов в корпусе. Каждый элемент матрицы показывает, сколько раз слово i встречается в контексте слова j (обычно в пределах фиксированного окна). Такая матрица агрегирует глобальную статистику по корпусу и используется в методах, таких как GloVe, для построения векторных представлений слов.