DeepWordBug
DeepWordBug
Определение
Метод black-box character-level атаки, вносящий минимальные опечатки в критически важные слова для тестирования robustness LLM.
Где встречается
- 298. Как вы тестируете robustness LLM к adversarial input (не только injection)
- 890. Как тестировать robustness LLM к adversarial inputs
- 800+ вопросов