中文翻译暂不可用,显示俄语原文。

Что такое «схема» (schema) в контексте LLM и как она связана с языковым представлением?

Краткий тезис

Схема в контексте LLM — это внутренний фреймворк активации и организации знаний, который определяет, как модель структурирует и обрабатывает информацию для решения задачи. Языковое представление (language representation) — это способ, которым мы кодируем задачу для LLM (промпт, формат, инструкция). Более структурированное и релевантное языковое представление активирует более сложные и подходящие схемы, что напрямую влияет на качество ответа. Понимание этой связи — ключ к эффективному промпт-инжинирингу и построению Agentic RAG-систем.


1. Термин: Схема (schema) в когнитивной науке и перенос на LLM

Схема — это когнитивная структура, которая организует знания и направляет обработку информации. В психологии (Пиаже, Бартлетт) схемы помогают интерпретировать новые данные на основе прошлого опыта. В LLM этот термин используется метафорически: модель обладает внутренними паттернами активации нейронов, которые соответствуют определённым типам задач.

  • Пример схемы у человека: схема «ресторан» включает ожидания: заказ, еда, оплата. При входе в ресторан мы активируем эту схему и действуем соответственно.
  • Пример схемы у LLM: схема «ответ на вопрос» включает: понимание запроса, поиск релевантных знаний в весах, генерацию ответа в формате факта. Если запрос требует рассуждения, активируется схема «цепочка рассуждений» (chain-of-thought).

Ключевая идея: LLM не имеет сознательных схем, но её обучение на огромном корпусе текстов приводит к формированию статистических паттернов, которые ведут себя как схемы. Они активируются в зависимости от входного контекста.


2. Термин: Языковое представление (language representation)

Языковое представление — это способ, которым мы формулируем задачу для LLM. Оно включает:

  • Формат: вопрос, инструкция, диалог, JSON, Markdown.
  • Структуру: порядок частей, разделители, примеры (few-shot).
  • Контент: конкретные слова, термины, контекст.

Чем точнее и структурированнее языковое представление, тем легче модели активировать нужную схему. Например:

  • Плохое представление: «Расскажи про RAG».
  • Хорошее представление: «Ты — эксперт по RAG. Объясни концепцию Retrieval-Augmented Generation в трёх предложениях. Используй аналогию с библиотекой.»

Второй вариант активирует схему «экспертное объяснение с аналогией», а первый — общую схему «генерация текста».


3. Как языковое представление активирует схемы

Механизм активации схемы через языковое представление можно описать так:

  1. Входной токен → активация эмбеддингов.
  2. Внимание (attention) → модель выделяет ключевые паттерны (слова-триггеры: «объясни», «сравни», «спланируй»).
  3. Внутреннее состояние → активируются определённые нейронные пути, соответствующие схеме.
  4. Генерация → модель продолжает в рамках активированной схемы.

Пример с кодом (упрощённая иллюстрация):

# Плохое представление — активируется общая схема
prompt_weak = "Что такое RAG?"
# Хорошее представление — активируется схема "пошаговое объяснение"
prompt_strong = """
Ты — AI-ассистент. Ответь на вопрос, используя следующий план:
1. Определение RAG.
2. Основные компоненты.
3. Пример использования.
Вопрос: Что такое RAG?
"""

Второй промпт явно задаёт структуру, и модель с высокой вероятностью сгенерирует ответ, соответствующий этой схеме.


4. Примеры схем в LLM и их активация

СхемаТриггер в языковом представленииРезультат
Chain-of-Thought (CoT)«Давайте подумаем шаг за шагом»Пошаговое рассуждение
Tool use«Используй инструмент поиска, чтобы найти...»Вызов функции (в API)
RAG«Обратись к предоставленным документам»Ответ на основе контекста
Summarization«Кратко перескажи следующий текст»Сжатое изложение
Agentic planning«Составь план действий для достижения цели»Многошаговый план

Каждая схема требует определённого языкового представления. Если промпт не содержит нужных триггеров, модель может активировать неверную схему (например, вместо анализа — простое копирование).


5. Связь с архитектурой Agentic RAG

В Agentic RAG схема играет критическую роль, потому что агент должен динамически выбирать, какую схему применить: поиск, рассуждение, вызов инструмента или генерацию ответа. Языковое представление в этом случае — это не только промпт, но и системное сообщение, которое задаёт общую схему поведения агента.

Пример архитектуры Agentic RAG:

  • Системный промпт: «Ты — агент, который может искать документы, анализировать их и отвечать. Если вопрос требует фактов, сначала выполни поиск. Если вопрос требует рассуждения, используй CoT.»
  • Пользовательский запрос: «Сравни эффективность RAG и fine-tuning для медицинских данных.»
  • Агент активирует схему «сравнение с поиском»: сначала retrieval, затем анализ, затем ответ.

Таким образом, правильное языковое представление (системный промпт + структура запроса) направляет агента на нужную схему.


6. Практические выводы для инженерии промптов

  • Явно указывайте схему: используйте инструкции, которые задают формат ответа (JSON, список, шаги).
  • Используйте триггерные слова: «объясни», «сравни», «спланируй», «найди в документах».
  • Структурируйте контекст: разделяйте инструкцию, примеры, вопрос — это помогает модели активировать схему «следование инструкции».
  • Тестируйте разные представления: одно и то же содержание, но разный порядок или формулировки могут активировать разные схемы.

Пример A/B теста:

# Вариант A — без явной схемы
prompt_a = "Как работает attention?"

# Вариант B — с явной схемой "объяснение для новичка"
prompt_b = """
Ты — преподаватель. Объясни тему "attention" простыми словами.
Используй аналогию с прожектором.
Вопрос: Как работает attention?
"""

Обычно вариант B даёт более понятный и структурированный ответ.


7. Пет-проект для закрепления

Задача: Создать систему, которая динамически выбирает схему ответа в зависимости от типа вопроса (фактологический, аналитический, творческий) и формирует соответствующее языковое представление.

Инструменты: Python, OpenAI API (или любая LLM), библиотека pydantic для схем.

Шаги:

  1. Определите три типа вопросов: факт (требует поиска), анализ (требует сравнения), генерация (требует креативности).
  2. Для каждого типа создайте шаблон промпта с явной схемой:
    • Факт: «Найди в документах и ответь кратко.»
    • Анализ: «Сравни X и Y, выдели 3 ключевых различия.»
    • Генерация: «Придумай историю на тему...»
  3. Реализуйте классификатор (можно использовать LLM с отдельным промптом) для определения типа вопроса.
  4. Напишите функцию, которая принимает вопрос, определяет тип, выбирает шаблон и генерирует ответ.
  5. Оцените качество ответов по сравнению с единым промптом.

Ожидаемый результат: Система, которая адаптирует схему под задачу, что повышает релевантность и структурированность ответов.


8. Связь с другими вопросами

ВопросТема
10Промпт-инжиниринг: как формулировать задачи
15Chain-of-Thought: активация схемы рассуждения
20RAG: схема поиска и генерации
25AI-агенты: динамический выбор схем
30Fine-tuning: изменение внутренних схем модели

Понимание схем и языкового представления — фундамент для всех продвинутых техник работы с LLM, от простых промптов до сложных агентных систем.


9. Навигация


Навигация