English translation is not available yet. Showing Russian content.

tokenizer

tokenizer

Определение

Компонент, преобразующий текст в последовательность токенов (субсловных единиц) для обработки LLM. Влияет на количество токенов, FLOPs и стоимость обучения. Современные алгоритмы: BPE, Unigram, SentencePiece.

Где встречается

Навигация