Word2Vec
Word2Vec
Определение
Word2Vec — это семейство моделей для обучения векторных представлений слов (эмбеддингов) на основе локального контекста. Модели включают архитектуры CBOW (Continuous Bag of Words) и Skip-gram. Word2Vec позволяет получать плотные (dense) векторы фиксированной размерности, которые отражают семантические и синтаксические отношения между словами.
Где встречается
- 911. Что такое Word2Vec (CBOW и Skip-gram) и fastText? Чем отличаются от контекстуальных эмбеддингов типа BERT?
- 913. Как работает scikit-learn для классификации текстов (TfidfVectorizer + LogisticRegression)? Когда такой пайплайн лучше нейросети?
- 926. Что такое Sparse Vector vs Dense Vector в контексте NLP? Назовите плюсы и минусы.
- 925. Что такое GloVe? Чем отличается от Word2Vec (матричные разложения vs локальные контексты)?
- 924. Как обучается Word2Vec? Объясните Negative Sampling и иерархический softmax.