Backdoor poisoning
Backdoor poisoning
Определение
Подтип embedding poisoning, активируемый только при наличии триггер-фразы в документе. При её появлении в запросе RAG-система выводит целевой вредоносный текст.
Где встречается
- 353. Как работает embedding poisoning для RAG и как защититься
- 883. Как защитить RAG от poisoning (вредоносные документы в базе знаний)