中文翻译暂不可用,显示俄语原文。

tokenizer

tokenizer

Определение

Компонент, преобразующий текст в последовательность токенов (субсловных единиц) для обработки LLM. Влияет на количество токенов, FLOPs и стоимость обучения. Современные алгоритмы: BPE, Unigram, SentencePiece.

Где встречается

Навигация