中文翻译暂不可用,显示俄语原文。

CLARE

CLARE

Определение

CLARE — фразовая атака на LLM, заменяющая или вставляющая целые фразы с сохранением смысла, используется для тестирования robustness к adversarial input.

Где встречается

Навигация