Dense Vector (NLP)
Dense Vector (NLP)
Определение
Плотный вектор (dense vector) — это способ представления текстовых данных в виде числового вектора фиксированной низкой размерности (обычно от 100 до 768), где каждое измерение содержит ненулевое значение. В отличие от разреженных векторов, плотные векторы позволяют улавливать семантические и контекстуальные связи между словами, что достигается за счет обучения на больших корпусах текстов (например, с помощью моделей word2vec или BERT).