Поиск

  • wikiscenario attack

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikiTaxonomy

    # Taxonomy ## Определение Классификация или таксономия типов вопросов, используемая при проектировании бенчмарков для оценки моделей в новом домене (например, медицина, юриспруденция…

  • wikiText classification

    # Text classification ## Определение Задача машинного обучения по присвоению тексту одной из предопределённых категорий, например, для маршрутизации входящих писем. ## Где встречается…

  • wikiperplexity-based detector

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikihypothetical attack

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikimoral reasoning attack

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikiOOD encoding

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…

  • wikiseverity classification

    # severity classification ## Определение Классификация инцидентов по степени влияния, применяемая в инцидент-менеджменте и при автоматическом postmortem. ## Где встречается - [[263. Реализовать…

  • wikiXML/JSON payloads

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…

  • wikiIntent classification

    # Intent classification ## Определение Задача определения намерения пользователя по запросу, используемая агентом для выбора инструмента или маршрутизации. ## Где встречается - [[46. Какие…

  • wikiJailbreakBench

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikimultilingual attack

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikiprompt leakage

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…

  • wikiRoBERTa

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…

  • wikiAdversarial suffix

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…

  • wikijailbreak taxonomy

    # jailbreak taxonomy ## Определение Систематическая классификация методов обхода ограничений LLM, включающая категории: OOD (out-of-distribution), refusal suppression, role-play, перевод…

  • wikirefusal suppression

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…

  • wikiDefense in Depth

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikimodel extraction

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…

  • wikiGCG

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…

  • wikicode injection

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] - [[102. Настроить Guardrails…

  • wikiMessage Type

    # Message Type ## Определение Классификация сообщений в протоколе коммуникации агентов, определяющая их назначение: команда, запрос, ответ, ошибка, handshake и т.д…

  • wikiтипы узлов

    # типы узлов ## Определение Классификация узлов в графе или диаграмме, используемая для извлечения логических отношений между элементами. ## Где встречается - [[800+ вопросов…

  • wikirefusal rate

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] - [[220. Настроить wave…

  • wikisequence classification

    # sequence classification ## Определение Задача бинарной классификации, решаемая верификатором: определение правильности каждого шага рассуждения в процессе декодирования. ## Где встречается - [[63. Реализовать…

  • wikiadversarial prompt detection

    # adversarial prompt detection ## Определение Классификация промпта как вредоносного или безопасного в реальном времени перед передачей основному LLM для защиты от…

  • wikirole-play

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…

  • wikiCode Classification

    # Code Classification ## Определение Упрощённая задача машинного обучения, направленная на определение свойств программного кода, например, наличия ошибки или типа функции; используется…

  • wikiZero-shot

    # Zero-shot ## Определение Способность LLM решать задачу без примеров, активируемая подходящим промптом (например, chain-of-thought). ## Где встречается - [[35. Как…

  • wikiRequest classification

    # Request classification ## Определение Определение типа запроса (rule-based, дешёвая LLM, дорогая LLM) перед отправкой для оптимизации стоимости и производительности. ## Где…

  • wikichain decomposition

    # chain decomposition ## Определение Разбиение сложного системного промпта на несколько последовательных вызовов LLM, например, сначала классификация, затем генерация. Упрощает отладку и…

  • wikiretryable / non-retryable

    # retryable / non-retryable ## Определение Классификация запросов: retryable можно безопасно повторить после прерывания, non-retryable требуют немедленной обработки, так как не…

  • wikiseverity

    # severity ## Определение Классификация инцидентов по степени влияния (P0–P3), определяющая обязательность postmortem и используемая для фильтрации ошибок в дашборде. ## Где…

  • wikiWord-Patch Alignment

    # Word-Patch Alignment ## Определение Бинарная классификация, определяющая, соответствует ли текстовый токен визуальному патчу в модели LayoutLMv3. Используется для обучения совместного…

  • wikiLong Range Arena

    # Long Range Arena ## Определение Набор бенчмарков (LRA) для оценки производительности моделей на задачах с длинными последовательностями, таких как классификация текста…

  • wikiImage-Text Matching

    # Image-Text Matching ## Определение Бинарная классификация, определяющая, соответствует ли текст данному изображению. Применяется как обучающая задача Q-Former на первом…

  • wikiattack success rate

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…

  • wikitask taxonomy

    # task taxonomy ## Определение Иерархическая классификация типов задач (task tree), разрабатываемая экспертами для структурирования бенчмарка. Обеспечивает покрытие всех сценариев использования и…

  • wikifalse positive

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[883. Как защитить RAG от poisoning (вредоносные…

  • wikiDistilBERT

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[892. Как работают verifier models для agentic…

  • answerКак работает CLIP и как training contrastive loss выравнивает текст и изображения?

    …zero-shot классификация и мультимодальный поиск [[Вики/Zero-shot\|Zero-shot классификация]]: 1. Для заданного набора классов (например, «собака», «кошка…

  • answerЧто такое jailbreak taxonomy (полная классификация)?

    …Что такое jailbreak taxonomy (полная классификация)? ## Краткий тезис [[Вики/jailbreak taxonomy\|Jailbreak taxonomy]] — это систематическая классификация атак, направленных на [[Вики…

  • wikired teaming

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[883. Как защитить RAG от poisoning (вредоносные…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Агент для email

    …отправка писем | | Разбор MIME | `email` (stdlib) | Извлечение текста/вложений | | Классификация | LLM API (OpenAI) / Hugging Face transformers | Определение типа письма | | Генерация…

  • wikiNeMo Guardrails

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[883. Как защитить RAG от poisoning (вредоносные…

  • answerЧто такое EU AI Act и как оно влияет на деплой LLM в production?

    …вы обязаны соблюдать [[Вики/Adaptive computation time\|Act]]. --- ## 2. Классификация рисков: четыре уровня Act|EU AI Act делит все системы…

  • wikiFew-shot examples

    …Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[Практика|Практика]] - [[800+ вопросов|800+ вопросов]] - [[69…

  • answerЧто такое LayoutLMv3 и зачем он для document understanding?

    …Зачем это нужно - Автоматизация обработки счетов, накладных, контрактов. - [[Вики/retrieval\|Извлечение]] ключевых полей (номер, дата, итоговая сумма). - Классификация документов по…

  • wikiBERT

    # BERT ## Определение BERT — предобученная языковая модель на основе трансформера, применяемая для широкого круга NLP-задач, таких как классификация и ранжирование…

  • answerЧто такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)?

    …Обучить BERT-классификатор на эмбеддингах текстов с метками категорий (многоклассовая классификация). 4. Создать ансамбль: если эвристика уверена (> confidence threshold) — использовать…