Likelihood Ratio Attack
Likelihood Ratio Attack
Определение
Продвинутая атака membership inference, основанная на вычислении отношения правдоподобия с помощью теневых моделей для обнаружения contamination.
Где встречается
- 350. Как вы детектируете data contamination в evaluation датасетах
- 602. Как работает membership inference атака на LLM