中文翻译暂不可用,显示俄语原文。
multilingual attack
multilingual attack
Определение
Атака на LLM, использующая редкие языки, на которых модель имеет недостаточно примеров безопасного поведения, для обхода фильтров и защит.
Где встречается
- 868. Что такое red teaming для LLM и как его проводить
- 881. Что такое jailbreak taxonomy (полная классификация)