response safety

response safety

Определение

Метрика, оценивающая долю ответов LLM, не содержащих вредоносный контент (инъекции, личные данные, опасные инструкции). Критична для развёртывания в публичных системах.

Где встречается

Навигация