Post-hoc rationalization

Определение

Явление, когда LLM сначала выдаёт ответ, а затем придумывает обоснование, которое может быть неверным. Один из failure modes в agentic AI.