English translation is not available yet. Showing Russian content.
role-play
role-play
Определение
Тип jailbreak-атаки, при которой LLM вводится в роль, допускающую вредоносные действия, чтобы обойти ограничения безопасности и цензуру.
Где встречается
- 352. Что такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)
- 597. Что такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)
- 618. Что такое jailbreak as a service (коммерческие jailbreak сервисы) и как защититься
- 625. Что такое adversarial prompt detection для реального времени (runtime)
- 736. Что такое red teaming certification (стандарты 2026 для оценки robustness)
- 868. Что такое red teaming для LLM и как его проводить
- 881. Что такое jailbreak taxonomy (полная классификация)
- 800+ вопросов