PyRIT
PyRIT
Определение
Библиотека Microsoft для red teaming LLM, позволяющая автоматизировать генерацию атак и оценку безопасности моделей.
Где встречается
- 127. Как вы проводите red teaming LLM-приложения Назовите 3 техники.
- 345. Как вы проектируете red teaming evaluation для jailbreak устойчивости
- 352. Что такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)
- 616. Как работает rainbow teaming (комбинация red + blue + purple teaming для LLM)
- 621. Как вы защищаете LLM от prompt injection через изображения (VL-модели)
- 736. Что такое red teaming certification (стандарты 2026 для оценки robustness)
- 868. Что такое red teaming для LLM и как его проводить
- 800+ вопросов