representation engineering
representation engineering
Определение
Подход к контролю поведения LLM на этапе инференса без дообучения, основанный на нахождении и сдвиге направлений в скрытом пространстве модели.
Подход к контролю поведения LLM на этапе инференса без дообучения, основанный на нахождении и сдвиге направлений в скрытом пространстве модели.