Поиск

  • wikisandwich technique

    # sandwich technique ## Определение Метод размещения ключевой инструкции в начале system-промпта и в конце последнего user-сообщения для улучшения следования…

  • wikiMemory-efficient inference

    # Memory-efficient inference ## Определение Методы снижения потребления памяти при инференсе моделей, позволяющие запускать крупные модели на оборудовании с ограниченной памятью…

  • wikideliberate decoding

    # deliberate decoding ## Определение Technique in reasoning models where multiple rounds of planning are performed before generating the final output, improving…

  • wikiTTPs

    # TTPs ## Определение Тактики, техники и процедуры, описывающие поведение злоумышленников. Используются в фреймворках MITRE ATT&CK и MITRE ATLAS для классификации…

  • wikiattention normalization

    # attention normalization ## Определение Модификация softmax-функции, позволяющая выдавать нулевые веса для нерелевантных токенов (например, sparse softmax или ReLU attention), используется…

  • wikiMITRE ATT&CK

    # MITRE ATT&CK ## Определение MITRE ATT&CK — общепризнанная база знаний тактик, техник и процедур кибератак, используемых злоумышленниками. ## Где встречается - [[126…

  • wikiAttention pruning

    # Attention pruning ## Определение Техника удаления неважных токенов из механизма внимания или KV cache для снижения вычислительной нагрузки и потребления памяти…

  • wikilogit lens

    # logit lens ## Определение Метод проецирования промежуточных слоев нейросети на выходной словарь через unembedding для анализа формирования предсказаний. ## Где встречается - [[295…

  • wiki5 почему

    # 5 почему ## Определение Метод поиска корневой причины проблемы путём последовательного задавания вопроса «почему» до выявления первопричины. Используется в postmortem-анализе…

  • wikiReward shaping

    # Reward shaping ## Определение Метод модификации функции награды путем добавления промежуточных наград для облегчения обучения в многошаговых задачах. ## Где встречается - [[334…

  • wikishadow model

    # shadow model ## Определение Вспомогательная модель, обучаемая на известных данных для имитации поведения целевой модели. Используется в membership inference атаках для…

  • wikiKV-cache reuse

    # KV-cache reuse ## Определение Техника ускорения инференса, при которой кэш ключей и значений предыдущих шагов сохраняется и переиспользуется для общих…

  • wikiStreamingLLM

    # StreamingLLM ## Определение Техника для работы с бесконечным контекстом: сохраняет начальные якорные токены и последнее окно, а остальные отбрасывает для сжатия…

  • wikirollback

    # rollback ## Определение Механизм возврата к предыдущей стабильной версии модели, промпта или конфигурации при обнаружении проблем, часто автоматизированный. ## Где встречается - [[430…

  • wikiattention sink

    # attention sink ## Определение Феномен, при котором первые токены контекста получают непропорционально много внимания, что ухудшает качество на длинных контекстах и…

  • wikisummarization

    # summarization ## Определение Процесс сжатия больших документов или истории диалога в краткое резюме с помощью LLM. Используется для экономии контекстного окна…

  • wikichunked prefill

    # chunked prefill ## Определение разбивает длинные промпты на части, чередуя prefill и decode, уменьшает TTFT для длинных промптов ## Где встречается - [[205…

  • wikitiling

    # tiling ## Определение Техника разбиения данных на небольшие блоки, помещающиеся в быструю память (например, shared memory GPU), для повышения локальности данных…

  • answerКак вы предотвращаете галлюцинации в production RAG системе?

    …Цитирование источников (core technique) Ключевой приём заставить [[Вики/GPT-4o\|LLM]] явно указывать в ответе, из какого документа взята каждая…

  • answerЧто такое MITRE ATLAS и как он связан с MITRE ATT&CK?

    …MITRE ATT&CK и MITRE ATLAS [[Вики/MITRE ATT&CK\|MITRE ATT&CK]] ([[Вики/adversarial input\|Adversarial]] Tactics, Techniques, and…

  • answerКак вы делаете synthetic data generation для редких классов в датасете?

    …Методы синтетической генерации данных для редких классов ### 3.1 Традиционные подходы (без LLM) - SMOTE (Synthetic Minority Over-sampling Technique): создаёт…

  • answerЧто такое SLI (Service Level Indicators) для AI системы и как их собирать?

    …Augmented Generation.'], 'contexts': [['Retrieval-Augmented Generation (RAG) is a technique...']] }) scores = evaluate(data, metrics=['faithfulness', 'answer_relevancy']) print(scores) ``` [[Вики…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить inference-time scaling для модели reasoning

    …iterative refinement techniques | ## 10. Чек-лист самопроверки - [ ] Я чётко понимаю разницу между train-time и test-time compute scaling. - [ ] Я…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить Guardrails на NeMo

    …текущая задача) | | 201 | LLM output filtering | | 305 | PII masking techniques | | 412 | Toxicity classification models | | 567 | Jailbreak attack taxonomy | | 623 | Colang…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Сравнить архитектуры на reasoning задачах (Mamba vs Transformer vs RWKV vs Hyena)

    …RNN + Transformer hybrid | | 301 | Comparison of language model architectures | | 405 | Reasoning benchmarks (GSM8K, MATH, BBH) | | 512 | Memory‑efficient inference techniques

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать simulation testing для AI-агента

    …unittest.mock vs responses vs aioresponses | | 45 | Fault injection techniques для микросервисов | | 67 | Resilience patterns: retry, circuit breaker, fallback | | 89…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать prefix caching для system prompt

    …722 | Memory management in transformer models | | 815 | Prompt compression techniques | | 901 | Benchmarking LLM serving systems | --- ## 10. Чек-лист самопроверки - [ ] Я…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать Evol-Instruct для instruction tuning

    …134 | How to generate synthetic data using LLMs? | | 205 | Techniques for data augmentation in text classification | | 310 | Evaluation metrics for…

  • wikiИндекс терминов

    …probability]] - [[Вики/sandbox escape|sandbox escape]] - [[Вики/sandwich technique|sandwich technique]] - [[Вики/sanitizer|sanitizer]] - [[Вики/Sanitizing parsing|Sanitizing parsing]] - [[Вики…