English translation is not available yet. Showing Russian content.
multilingual attack
multilingual attack
Определение
Атака на LLM, использующая редкие языки, на которых модель имеет недостаточно примеров безопасного поведения, для обхода фильтров и защит.
Где встречается
- 868. Что такое red teaming для LLM и как его проводить
- 881. Что такое jailbreak taxonomy (полная классификация)