中文翻译暂不可用,显示俄语原文。

BPE

BPE

Определение

BPE (Byte Pair Encoding) — алгоритм субсловной токенизации, который итеративно сливает наиболее частые пары символов или токенов. Используется в моделях GPT, BERT, RoBERTa и Whisper для обработки текста на 90+ языках, но неэффективен для представления чисел.

Где встречается

Навигация