Поиск

  • wikilikelihood

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…

  • wikiByT5

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…

  • wikiMegaByte

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…

  • wikiOOV

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…

  • wikiNFKC

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…

  • wikibyte-level tokenization

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…

  • wikiUnigram

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…

  • wikipre-tokenization

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…

  • wikiSentencePiece

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…

  • wikiBPE

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…

  • wikiLoss

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…

  • wikitokenizer

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…

  • wikiPerplexity

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…

  • answerКак работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения?

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения? ## Краткий тезис Современные токенизаторы преобразуют текст в [[Вики/sequence\|последовательность…

  • answerЧто такое selective attention в контексте long context обработки?

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения\|284]] | Sparse attention: фиксированные паттерны | | [[285. Как вы анализируете embedding…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать prefix caching для system prompt

    …100, 300, 500 токенов) через скрипт: ```python import tokenizers tokenizer = tokenizers.Tokenizer.from_pretrained("facebook/opt-125m") long_system = "Ты…

  • answerКак работает MoE (Mixture of Experts) внутри LLM (Mixtral, GPT-4)?

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения\|284]] | Model Parallelism и распределение моделей | | [[285. Как вы анализируете…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать process reward model (PRM)

    …обучение | PyTorch 2.x | Обучение PRM | | HuggingFace Transformers | transformers, tokenizers | Загрузка базовой модели (например, DeepSeek-Math-Base-7B) | | Библиотека для…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать evaluation для long context (Needle in a Haystack на 32k, 64k, 128k)

    …Технологический стек | Компонент | Инструменты | Назначение | |-----------|-------------|------------| | Язык программирования | Python 3.10+ | Разработка и запуск скриптов | | Токенизация | `tiktoken` / `tokenizers` | Подсчёт и обрезка…

  • answerЧто такое sliding window attention и зачем он в Mistral?

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения\|284]] | Mistral 7B vs Llama [[2 Как вы решаете проблему…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить RWKV для инференса

    …4.38.2`, `gpt2` | Базовая модель для сравнения | | Токенизация | `tokenizers` (оба семейства) | Кодирование/декодирование текста | | Бенчмаркинг | `time.perf_counter`, `torch…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать verifier-guided decoding

    …question (str), [[Вики/generator\|generator]], [[Вики/target model\|verifier]], tokenizers, параметры ([[Вики/beam_width\|beam_width]], [[Вики/max_iterations\|max…

  • answerКак вы анализируете embedding geometry для отладки retrieval качества?

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения\|284]] - Следующий: [[286. Как вы детектируете и фиксите attention sinks…

  • indexИндекс разборов

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения\|284. Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их…

  • indexПРАКТИЧЕСКИЙ ЧЕКЛИСТ: СТАFF+ AI SYSTEMS ENGINEERING

    …Exist 435 | | 283 | Selective attention | Inf 206-207 | | 284 | Tokenizers | Pet 221 | | 285 | Embedding geometry | Pet 229, Pet 236 | | 286…

  • indexОглавление

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения\|284. Как работают современные tokenizers (BPE, Unigram, SentenceP]] - [[Вопросы/Ответы…

  • question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)

    …Как работают современные tokenizers (BPE, Unigram, SentencePiece) и их ограничения?** > *Ответ:* BPE: итеративное слияние частотных пар. Unigram: вероятностная модель. SentencePiece…