中文翻译暂不可用,显示俄语原文。
tuned lens
tuned lens
Определение
Tuned lens — метод интерпретации внутренних представлений нейросети, при котором для каждого слоя обучается линейная проекция (или аффинное преобразование) на пространство вероятностей, что позволяет точнее, чем logit lens, оценивать вклад слоя в финальный ответ.
Где встречается
- 295. Что такое logit lens и как он помогает понимать внутренние представления
- 674. Что такое logit lens (интерпретация скрытых состояний)