English translation is not available yet. Showing Russian content.
representation engineering
representation engineering
Определение
Подход к контролю поведения LLM на этапе инференса без дообучения, основанный на нахождении и сдвиге направлений в скрытом пространстве модели.