vocabulary size
vocabulary size
Определение
Количество уникальных токенов в словаре токенизатора модели; влияет на размер эмбеддингов, выходную размерность softmax и среднее количество токенов на слово.
Где встречается
- 456. Что такое Medusa (multiple heads) для speculative decoding
- 656. Как работает кросс-энтропия (cross-entropy loss) для LLM обучения
- 677. Как работает forward pass LLM от токена до вероятности следующего токена
- 800+ вопросов