中文翻译暂不可用,显示俄语原文。

red teaming

red teaming

Определение

Метод тестирования безопасности LLM-приложений путём имитации целенаправленных атак (adversarial). Цель — выявить уязвимости, такие как jailbreak, и повысить устойчивость модели.

Где встречается

Навигация