中文翻译暂不可用,显示俄语原文。

Что такое «Clone-Structured Causal Graphs» (CSCG) и как они связаны со схемами?

Краткий тезис

Graphs|Clone-Structured Causal Graphs (CSCG) — это метод представления обобщённых шаблонов (схем) в нейросетях, при котором модель учится выделять абстрактную причинно-следственную структуру и «клонировать» её для новых объектов, подставляя конкретные токены в слоты. CSCG объясняют, как LLM могут решать задачи по аналогии, переносить знания на новые комбинации и эффективно использовать in-context learning. Связь со схемами прямая: схема — это шаблонная цепь (template circuit), а CSCG — её графовое представление с механизмом клонирования.


1. Термин: Clone-Structured Causal Graphs (CSCG)

CSCG — это orchestration|направленный ациклический граф (DAG), в котором узлы представляют переменные (токены, скрытые состояния), а рёбра — причинные зависимости. Ключевая особенность: граф содержит клонируемые подграфы — повторяющиеся структуры, которые соответствуют одному и тому же шаблону, но с разными конкретными значениями. Термин введён в работах по механистической интерпретируемости (например, Anthropic) для описания того, как модели обобщают на новые примеры.

Пример: В задаче «A относится к B как C относится к ?» модель может иметь шаблон «отношение(X, Y)». При предъявлении новой пары (C, ?) она клонирует этот шаблон, подставляя C в слот X, и вычисляет Y.


2. Термин: Схемы (template circuits)

Схема (template circuit) — это повторяющийся вычислительный паттерн в нейросети, который активируется для определённого типа задач. В контексте CSCG схема — это абстрактная причинная структура, не привязанная к конкретным токенам. Она содержит слоты — места, куда могут быть подставлены разные объекты. Например, схема «сравнение размеров» может иметь слоты для двух объектов и выхода «больше/меньше».

Связь с CSCG: CSCG — это графовое представление схемы, где каждый слот обозначен как узел, а клонирование позволяет инстанцировать схему для новых данных.


3. Как CSCG обобщают: привязка токенов к слотам

Процесс обобщения через CSCG состоит из трёх шагов:

  1. Выделение схемы — модель на основе контекста (например, нескольких примеров в few-shot) определяет абстрактную структуру (схему) и её слоты.
  2. Клонирование графа — для каждого нового входа модель создаёт копию схемы (клонирует подграф), связывая её с текущими токенами.
  3. Заполнение слотов — конкретные токены (например, «C» и «?») подставляются в соответствующие узлы клонированного графа, и выполняется причинный вывод.

Этот механизм позволяет модели решать задачи, не встречавшиеся в обучении, если они подчиняются той же схеме.


4. Пример работы CSCG на задаче аналогий

Рассмотрим классическую аналогию: «король — мужчина, королева — ?». Внутри модели может существовать схема «пол(X) → Y», где X — объект, Y — его парная форма. Для пары (король, мужчина) схема учится, что «король» заполняет слот X, а «мужчина» — результат. Для нового запроса «королева» модель клонирует схему, подставляет «королева» в слот X и получает «женщина».

Визуализация CSCG

Схема (шаблон):
  [X] → [пол] → [Y]

Клонирование для пары (король, мужчина):
  [король] → [пол] → [мужчина]

Клонирование для (королева, ?):
  [королева] → [пол] → [женщина]

Графы для двух примеров имеют одинаковую структуру (рёбра, узлы), но разные значения в слотах.


5. Связь CSCG с механистической интерпретируемостью

Механистическая интерпретируемость (mechanistic interpretability) пытается понять, как именно нейросеть вычисляет ответы. CSCG — один из инструментов такого анализа. Исследователи (например, из Anthropic) показывают, что в трансформерах существуют схемы (circuits), которые активируются для определённых паттернов. CSCG формализует эти схемы как клонируемые графы.

Практическое значение если мы знаем CSCG для данной задачи, мы можем предсказать поведение модели на новых данных, а также целенаправленно модифицировать схему (например, через fine-tuning) для улучшения обобщения.


6. Значение CSCG для Agentic RAG

В Agentic RAG агент должен не просто извлекать документы, но и рассуждать, планировать, обобщать. CSCG помогают агенту:

  • Переносить стратегии — если агент научился решать задачу по шаблону (например, «найти документ, извлечь факт, проверить источник»), он может клонировать эту схему для новых запросов.
  • Обрабатывать новые типы вопросов — агент может выделить абстрактную структуру запроса (схему) и применить её, даже если конкретные сущности не встречались.
  • Улучшать few-shot learning — CSCG объясняют, почему несколько примеров в промпте могут кардинально изменить поведение агента: они задают схему, которая затем клонируется.

7. Как CSCG отличаются от других методов обобщения

МетодСутьОтличие от CSCG
Weight sharingОдни и те же веса применяются к разным входам (свёртки, RNN)CSCG не требует общих весов; клонируется структура, а не параметры
In-context learningМодель использует примеры в промпте без изменения весовCSCG — возможный механизм, лежащий в основе ICL; граф клонируется динамически
Fine-tuningОбновление весов под новую задачуCSCG работает без изменения весов, только за счёт активации схем
Meta-learningОбучение «учиться» на нескольких примерахCSCG может быть реализацией meta-learning на уровне графов

CSCG ближе всего к in-context learning, но даёт более формальное графовое описание.


8. Ограничения и открытые вопросы

  • Масштабируемость — как точно выделить CSCG в большой модели? Текущие методы (активационные патчи, probing) трудоёмки.
  • Универсальность — все ли обобщения в LLM объясняются CSCG? Возможно, есть и другие механизмы (например, линейные подпространства).
  • Связь с attention — как CSCG соотносятся с attention heads? Предполагается, что схемы реализуются через комбинации heads, но точная карта неясна.
  • Обучение CSCG — можно ли явно обучить модель строить такие графы? Это область активных исследований.

9. Пет-проект для закрепления

Задача Реализовать симуляцию CSCG для задачи аналогий на синтетических данных.

Инструменты Python, библиотека networkx для графов, numpy для простых вычислений.

Шаги:

  1. Определите абстрактную схему для отношения «столица страны»: слоты [страна] → [столица].
  2. Создайте базовый граф схемы (два узла, одно ребро).
  3. Для каждой пары (страна, столица) из обучающего набора (например, Франция-Париж, Германия-Берлин) клонируйте граф, подставляя конкретные токены.
  4. Для тестового запроса (Италия, ?) найдите клонированный граф с той же схемой, подставьте «Италия» и вычислите предсказание (например, через простую ассоциативную память).
  5. Оцените точность на нескольких примерах.

Ожидаемый результат Вы увидите, что одна и та же структура графа (схема) позволяет обобщать на новые страны, если схема была выучена на нескольких примерах. Это демонстрирует ключевую идею CSCG.


10. Связь с другими вопросами

ВопросТема
45Few-shot learning в LLM
78In-context learning: механизмы и ограничения
120Механистическая интерпретируемость трансформеров
150Обобщение в нейросетях: индуктивные biases
200Архитектура Agentic RAG: планирование и рассуждение
210Template circuits и их роль в reasoning

Навигация