BERT-Attack
BERT-Attack
Определение
BERT-Attack — метод атаки, заменяющий слова на контекстно-зависимые синонимы с помощью BERT, для тестирования robustness LLM.
Где встречается
- 298. Как вы тестируете robustness LLM к adversarial input (не только injection)
- 890. Как тестировать robustness LLM к adversarial inputs
- Практика
- 800+ вопросов
- 279. Настроить adversarial evaluation для RAG