Поиск
- wikilikelihood
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…
- wikiByT5
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…
- wikiMegaByte
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…
- wikiOOV
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…
- wikiNFKC
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…
- wikibyte-level tokenization
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…
- wikiUnigram
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…
- wikipre-tokenization
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…
- wikiSentencePiece
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…
- wikiBPE
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…
- wikiLoss
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…
- wikitokenizer
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…
- wikiPerplexity
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…
- answerКак работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения?
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения? ## Краткий тезис Современные токенизаторы преобразуют текст в [[Вики/sequence\|последовательность…
- answerЧто такое selective attention в контексте long context обработки?
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения\|284]] | Sparse attention: фиксированные паттерны | | [[285. Как вы анализируете embedding…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать prefix caching для system prompt
…100, 300, 500 токенов) через скрипт: ```python import tokenizers tokenizer = tokenizers.Tokenizer.from_pretrained("facebook/opt-125m") long_system = "Ты…
- answerКак работает MoE (Mixture of Experts) внутри LLM (Mixtral, GPT-4)?
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения\|284]] | Model Parallelism и распределение моделей | | [[285. Как вы анализируете…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать process reward model (PRM)
…обучение | PyTorch 2.x | Обучение PRM | | HuggingFace Transformers | transformers, tokenizers | Загрузка базовой модели (например, DeepSeek-Math-Base-7B) | | Библиотека для…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать evaluation для long context (Needle in a Haystack на 32k, 64k, 128k)
…Технологический стек | Компонент | Инструменты | Назначение | |-----------|-------------|------------| | Язык программирования | Python 3.10+ | Разработка и запуск скриптов | | Токенизация | `tiktoken` / `tokenizers` | Подсчёт и обрезка…
- answerЧто такое sliding window attention и зачем он в Mistral?
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения\|284]] | Mistral 7B vs Llama [[2 Как вы решаете проблему…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить RWKV для инференса
…4.38.2`, `gpt2` | Базовая модель для сравнения | | Токенизация | `tokenizers` (оба семейства) | Кодирование/декодирование текста | | Бенчмаркинг | `time.perf_counter`, `torch…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать verifier-guided decoding
…question (str), [[Вики/generator\|generator]], [[Вики/target model\|verifier]], tokenizers, параметры ([[Вики/beam_width\|beam_width]], [[Вики/max_iterations\|max…
- answerКак вы анализируете embedding geometry для отладки retrieval качества?
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения\|284]] - Следующий: [[286. Как вы детектируете и фиксите attention sinks…
- indexИндекс разборов
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения\|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…
- indexПРАКТИЧЕСКИЙ ЧЕКЛИСТ: СТАFF+ AI SYSTEMS ENGINEERING
…Exist 435 | | 283 | Selective attention | Inf 206-207 | | 284 | Tokenizers | Pet 221 | | 285 | Embedding geometry | Pet 229, Pet 236 | | 286…
- indexОглавление
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения\|284. Как работают современные tokenizers (BPE, Unigram, SentenceP]] - [[Вопросы/Ответы…
- question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)
…Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения?** > *Ответ:* BPE: итеративное слияние частотных пар. Unigram: вероятностная модель. SentencePiece…