Gradient × Input
Gradient × Input
Определение
Gradient × Input — это метод объяснения предсказаний модели, который вычисляет градиент выходного значения по отношению к входным признакам и умножает его на сами признаки. Результат показывает, как каждый входной признак влияет на выход модели, с учётом как величины градиента, так и значения признака. Этот метод часто даёт более содержательные объяснения, чем анализ сырых весов внимания (raw attention), поскольку учитывает чувствительность модели к изменениям в конкретных элементах входа.