multilingual attack

multilingual attack

Определение

Атака на LLM, использующая редкие языки, на которых модель имеет недостаточно примеров безопасного поведения, для обхода фильтров и защит.

Где встречается

Навигация