tuned lens

tuned lens

Определение

Tuned lens — метод интерпретации внутренних представлений нейросети, при котором для каждого слоя обучается линейная проекция (или аффинное преобразование) на пространство вероятностей, что позволяет точнее, чем logit lens, оценивать вклад слоя в финальный ответ.

Где встречается

Навигация