Microsoft Counterfit
Microsoft Counterfit
Определение
Инструмент от Microsoft для автоматизированной генерации adversarial примеров и оценки безопасности AI-моделей.
Где встречается
- 616. Как работает rainbow teaming (комбинация red + blue + purple teaming для LLM)
- 868. Что такое red teaming для LLM и как его проводить
- 800+ вопросов