Поиск
- wikiscenario attack
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiTaxonomy
# Taxonomy ## Определение Классификация или таксономия типов вопросов, используемая при проектировании бенчмарков для оценки моделей в новом домене (например, медицина, юриспруденция…
- wikiText classification
# Text classification ## Определение Задача машинного обучения по присвоению тексту одной из предопределённых категорий, например, для маршрутизации входящих писем. ## Где встречается…
- wikiperplexity-based detector
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikihypothetical attack
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikimoral reasoning attack
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiOOD encoding
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…
- wikiseverity classification
# severity classification ## Определение Классификация инцидентов по степени влияния, применяемая в инцидент-менеджменте и при автоматическом postmortem. ## Где встречается - [[263. Реализовать…
- wikiXML/JSON payloads
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…
- wikiIntent classification
# Intent classification ## Определение Задача определения намерения пользователя по запросу, используемая агентом для выбора инструмента или маршрутизации. ## Где встречается - [[46. Какие…
- wikiJailbreakBench
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikimultilingual attack
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiprompt leakage
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…
- wikiRoBERTa
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…
- wikiAdversarial suffix
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…
- wikijailbreak taxonomy
# jailbreak taxonomy ## Определение Систематическая классификация методов обхода ограничений LLM, включающая категории: OOD (out-of-distribution), refusal suppression, role-play, перевод…
- wikirefusal suppression
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…
- wikiDefense in Depth
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikimodel extraction
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…
- wikiGCG
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…
- wikicode injection
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] - [[102. Настроить Guardrails…
- wikiMessage Type
# Message Type ## Определение Классификация сообщений в протоколе коммуникации агентов, определяющая их назначение: команда, запрос, ответ, ошибка, handshake и т.д…
- wikiтипы узлов
# типы узлов ## Определение Классификация узлов в графе или диаграмме, используемая для извлечения логических отношений между элементами. ## Где встречается - [[800+ вопросов…
- wikirefusal rate
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] - [[220. Настроить wave…
- wikisequence classification
# sequence classification ## Определение Задача бинарной классификации, решаемая верификатором: определение правильности каждого шага рассуждения в процессе декодирования. ## Где встречается - [[63. Реализовать…
- wikiadversarial prompt detection
# adversarial prompt detection ## Определение Классификация промпта как вредоносного или безопасного в реальном времени перед передачей основному LLM для защиты от…
- wikirole-play
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…
- wikiCode Classification
# Code Classification ## Определение Упрощённая задача машинного обучения, направленная на определение свойств программного кода, например, наличия ошибки или типа функции; используется…
- wikiZero-shot
# Zero-shot ## Определение Способность LLM решать задачу без примеров, активируемая подходящим промптом (например, chain-of-thought). ## Где встречается - [[35. Как…
- wikiRequest classification
# Request classification ## Определение Определение типа запроса (rule-based, дешёвая LLM, дорогая LLM) перед отправкой для оптимизации стоимости и производительности. ## Где…
- wikichain decomposition
# chain decomposition ## Определение Разбиение сложного системного промпта на несколько последовательных вызовов LLM, например, сначала классификация, затем генерация. Упрощает отладку и…
- wikiretryable / non-retryable
# retryable / non-retryable ## Определение Классификация запросов: retryable можно безопасно повторить после прерывания, non-retryable требуют немедленной обработки, так как не…
- wikiseverity
# severity ## Определение Классификация инцидентов по степени влияния (P0–P3), определяющая обязательность postmortem и используемая для фильтрации ошибок в дашборде. ## Где…
- wikiWord-Patch Alignment
# Word-Patch Alignment ## Определение Бинарная классификация, определяющая, соответствует ли текстовый токен визуальному патчу в модели LayoutLMv3. Используется для обучения совместного…
- wikiLong Range Arena
# Long Range Arena ## Определение Набор бенчмарков (LRA) для оценки производительности моделей на задачах с длинными последовательностями, таких как классификация текста…
- wikiImage-Text Matching
# Image-Text Matching ## Определение Бинарная классификация, определяющая, соответствует ли текст данному изображению. Применяется как обучающая задача Q-Former на первом…
- wikiattack success rate
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…
- wikitask taxonomy
# task taxonomy ## Определение Иерархическая классификация типов задач (task tree), разрабатываемая экспертами для структурирования бенчмарка. Обеспечивает покрытие всех сценариев использования и…
- wikifalse positive
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[883. Как защитить RAG от poisoning (вредоносные…
- wikiDistilBERT
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[892. Как работают verifier models для agentic…
- answerКак работает CLIP и как training contrastive loss выравнивает текст и изображения?
…zero-shot классификация и мультимодальный поиск [[Вики/Zero-shot\|Zero-shot классификация]]: 1. Для заданного набора классов (например, «собака», «кошка…
- answerЧто такое jailbreak taxonomy (полная классификация)?
…Что такое jailbreak taxonomy (полная классификация)? ## Краткий тезис [[Вики/jailbreak taxonomy\|Jailbreak taxonomy]] — это систематическая классификация атак, направленных на [[Вики…
- wikired teaming
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[883. Как защитить RAG от poisoning (вредоносные…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Агент для email
…отправка писем | | Разбор MIME | `email` (stdlib) | Извлечение текста/вложений | | Классификация | LLM API (OpenAI) / Hugging Face transformers | Определение типа письма | | Генерация…
- wikiNeMo Guardrails
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[883. Как защитить RAG от poisoning (вредоносные…
- answerЧто такое EU AI Act и как оно влияет на деплой LLM в production?
…вы обязаны соблюдать [[Вики/Adaptive computation time\|Act]]. --- ## 2. Классификация рисков: четыре уровня Act|EU AI Act делит все системы…
- wikiFew-shot examples
…Что такое jailbreak taxonomy (полная классификация)|881. Что такое jailbreak taxonomy (полная классификация)]] - [[Практика|Практика]] - [[800+ вопросов|800+ вопросов]] - [[69…
- answerЧто такое LayoutLMv3 и зачем он для document understanding?
…Зачем это нужно - Автоматизация обработки счетов, накладных, контрактов. - [[Вики/retrieval\|Извлечение]] ключевых полей (номер, дата, итоговая сумма). - Классификация документов по…
- wikiBERT
# BERT ## Определение BERT — предобученная языковая модель на основе трансформера, применяемая для широкого круга NLP-задач, таких как классификация и ранжирование…
- answerЧто такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)?
…Обучить BERT-классификатор на эмбеддингах текстов с метками категорий (многоклассовая классификация). 4. Создать ансамбль: если эвристика уверена (> confidence threshold) — использовать…