中文翻译暂不可用,显示俄语原文。
Causal Tracing
Causal Tracing
Определение
Метод локализации знаний в LLM: зашумляются активации отдельных слоёв, и по падению уверенности модели определяется, где хранится конкретная информация.
中文翻译暂不可用,显示俄语原文。
Метод локализации знаний в LLM: зашумляются активации отдельных слоёв, и по падению уверенности модели определяется, где хранится конкретная информация.