1. [[Вики/State Bloat\|Разрастание состояния]] — если хранить все промежуточные результаты, [[Вики/state\|состояние]] может стать огромным, замедляя передачу и увеличивая [[Вики/Inference cost\|затраты]] на [[Вики/LLM\|LLM]] ([[Вики/Token budgets\|контекстное окно]]). 2. Конфликты при параллелизме — если [[Вики/agent\|агент]] запускает несколько веток (например, параллельные [[Вики/API вызовы инструментов\|вызовы инструментов]]), [[Вики/state\|состояние]] может быть повреждено.

- Минимализм: хранить только то, что нужно для следующих шагов. Например, не хранить полные тексты чанков, только их ID или краткое содержание. - Явные поля: использовать [[Вики/TypedDict\|TypedDict]], а не общий dict с произвольными ключами. - Редьюсеры для агрегации: если нужно накапливать данные (например, список ошибок), используйте [[Вики/Reducer\|редьюсер]] `[[Вики/Add\|add]]` или кастомный.

Как вы передаете состояние (state) между шагами агента?

Q: 1. Термин: State (состояние) агента

Почему это важно - [[Вики/AI agents\|Агент]] — это не stateless-функция; он принимает решения на основе предыдущих шагов. - Без правильной передачи состояния [[Вики/AI agents\|агент]] «забывает» контекст, что приводит к бессвязным ответам. - [[Вики/state\|Состояние]] должно быть сериализуемым (для логирования, отладки, восстановления после сбоев) и детерминированным ([[Вики/consistency\|воспроизводимость]]).

Q: 2. Основные подходы к передаче состояния

| Подход | Описание | Плюсы | Минусы | |--------|----------|-------|--------| | Глобальная переменная / словарь | Храним всё в одном dict, передаём по ссылке | Простота реализации | Небезопасно при параллелизме, трудно отлаживать | | **Объект состояния (State Object)** | Специальный класс с полями, передаётся между шагами | Типобезопасность, явные поля | Требует boilerplate-кода |

Q: 3. LangGraph State Schema: TypedDict и редьюсеры

Пример базовой [[Вики/template circuits\|схемы]] from typing import TypedDict, Annotated, Sequence from langgraph.graph import add_messages from langchain_core.messages import BaseMessage class AgentState(TypedDict): messages: Annotated[Sequence[BaseMessage], add_messages] retrieved_chunks: list[str]

Q: 4. Типичные поля состояния в Agentic RAG

| Поле | Тип | Назначение | Пример обновления | |------|-----|------------|-------------------| | `messages` | Sequence[BaseMessage] | История диалога | Добавляется каждое новое сообщение | | `retrieved_chunks` | list[str] | Чанки, полученные из векторной БД | Перезаписываются при новом поиске |

Q: 6. Пример кода: передача состояния в LangGraph

from typing import TypedDict, Annotated, Sequence from langgraph.graph import StateGraph, add_messages from langchain_core.messages import HumanMessage, AIMessage

Краткий тезис

Передача состояния между шагами агента — ключевой механизм, обеспечивающий согласованность и контекст в многошаговых рассуждениях. Лучшая практика — использование LangGraph State Schema с TypedDict и явными полями (messages, retrieved_chunks, intermediate_answers). Необходимо хранить только минимально необходимые данные, избегая дублирования и переполнения контекста. Правильное управление состоянием напрямую влияет на производительность, отказоустойчивость и интерпретируемость агента.

1. Термин: State (состояние) агента

Состояние агента — это совокупность данных, которые агент накапливает и использует в процессе выполнения задачи. В Agentic RAG состояние включает историю диалога, результаты поиска, промежуточные рассуждения, выбранные инструменты и их результаты.

Почему это важно

Агент — это не stateless-функция; он принимает решения на основе предыдущих шагов.
Без правильной передачи состояния агент «забывает» контекст, что приводит к бессвязным ответам.
Состояние должно быть сериализуемым (для логирования, отладки, восстановления после сбоев) и детерминированным (воспроизводимость).

2. Основные подходы к передаче состояния

Подход	Описание	Плюсы	Минусы
Глобальная переменная / словарь	Храним всё в одном dict, передаём по ссылке	Простота реализации	Небезопасно при параллелизме, трудно отлаживать
Объект состояния (State Object)	Специальный класс с полями, передаётся между шагами	Типобезопасность, явные поля	Требует boilerplate-кода
База данных / Redis	Состояние сохраняется во внешнем хранилище	Устойчивость к сбоям, масштабирование	Задержки на запись/чтение, сложность
LangGraph State Schema	Декларативное описание состояния с редьюсерами	Встроенная поддержка графов, автоматическое обновление	Привязка к фреймворку

Лучшая практика для RAG|Agentic RAG — LangGraph State Schema (или аналоги в других фреймворках), так как она обеспечивает чёткую структуру, контроль версий и интеграцию с графом выполнения.

3. LangGraph State Schema: TypedDict и редьюсеры

LangGraph — библиотека для построения агентов в виде графов. Состояние описывается через TypedDict (или dataclass) с аннотациями типов. Каждое поле может иметь редьюсер — функцию, определяющую, как обновлять значение при добавлении нового.

Пример базовой схемы

from typing import TypedDict, Annotated, Sequence
from langgraph.graph import add_messages
from langchain_core.messages import BaseMessage

class AgentState(TypedDict):
    messages: Annotated[Sequence[BaseMessage], add_messages]
    retrieved_chunks: list[str]
    intermediate_answers: list[str]
    current_tool: str
    is_finished: bool

Ключевые моменты

messages — история диалога; редьюсер add_messages автоматически добавляет новые сообщения к существующим.
retrieved_chunks — найденные фрагменты документов; можно перезаписывать или дополнять.
intermediate_answers — ответы на подвопросы (например, после вызова инструмента).
current_tool — имя текущего инструмента (для логирования).
is_finished — флаг завершения.

Редьюсеры — это функции, которые получают текущее значение и новое, и возвращают обновлённое. Встроенные: add_messages, add (для чисел), replace (по умолчанию). Можно писать свои.

4. Типичные поля состояния в Agentic RAG

Поле	Тип	Назначение	Пример обновления
`messages`	Sequence[BaseMessage]	История диалога	Добавляется каждое новое сообщение
`retrieved_chunks`	list[str]	Чанки, полученные из векторной БД	Перезаписываются при новом поиске
`intermediate_answers`	list[str]	Ответы на подвопросы (chain-of-thought)	Добавляются после каждого шага рассуждения
`tool_calls`	list[dict]	Вызовы инструментов (имя, аргументы, результат)	Добавляются при каждом вызове
`user_intent`	str	Распознанное намерение пользователя	Устанавливается один раз в начале
`confidence`	float	Уверенность в текущем ответе	Обновляется после проверки фактов
`error_count`	int	Количество ошибок при вызове инструментов	Инкрементируется при неудаче

Важно не хранить всё подряд. Каждое поле должно быть обосновано необходимостью для принятия решений агентом.

5. Проблемы и best practices

Проблемы

Разрастание состояния — если хранить все промежуточные результаты, состояние может стать огромным, замедляя передачу и увеличивая затраты на LLM (контекстное окно).
Конфликты при параллелизме — если агент запускает несколько веток (например, параллельные вызовы инструментов), состояние может быть повреждено.
Сериализация — не все объекты (например, модели, соединения) можно сериализовать. Нужно хранить только данные.
Восстановление после сбоя — если агент упал, состояние должно быть сохранено для перезапуска.

Best practices

Минимализм: хранить только то, что нужно для следующих шагов. Например, не хранить полные тексты чанков, только их ID или краткое содержание.
Явные поля: использовать TypedDict, а не общий dict с произвольными ключами.
Редьюсеры для агрегации: если нужно накапливать данные (например, список ошибок), используйте редьюсер add или кастомный.
Чекпоинты (checkpointing): в LangGraph встроена возможность сохранять состояние после каждого шага (persistence), что позволяет восстанавливать выполнение.
Тестирование: писать unit-тесты на обновление состояния (проверять, что редьюсеры работают корректно).

6. Пример кода: передача состояния в LangGraph

from typing import TypedDict, Annotated, Sequence
from langgraph.graph import StateGraph, add_messages
from langchain_core.messages import HumanMessage, AIMessage

# Определяем состояние
class AgentState(TypedDict):
    messages: Annotated[Sequence, add_messages]
    retrieved_chunks: list[str]
    intermediate_answers: list[str]

# Функция-узел: поиск документов
def retrieve(state: AgentState) -> dict:
    query = state["messages"][-1].content
    chunks = vector_store.similarity_search(query, k=3)
    return {"retrieved_chunks": [chunk.page_content for chunk in chunks]}

# Функция-узел: генерация ответа
def generate(state: AgentState) -> dict:
    context = "\n".join(state["retrieved_chunks"])
    prompt = f"Context: {context}\nQuestion: {state['messages'][-1].content}"
    answer = llm.invoke(prompt)
    return {"messages": [AIMessage(content=answer)], "intermediate_answers": [answer]}

# Строим граф
builder = StateGraph(AgentState)
builder.add_node("retrieve", retrieve)
builder.add_node("generate", generate)
builder.set_entry_point("retrieve")
builder.add_edge("retrieve", "generate")
builder.set_finish_point("generate")
graph = builder.compile()

# Запуск
initial_state = {"messages": [HumanMessage(content="Что такое RAG?")],
                 "retrieved_chunks": [],
                 "intermediate_answers": []}
result = graph.invoke(initial_state)
print(result["messages"][-1].content)

Объяснение

Состояние передаётся между узлами автоматически.
Узел retrieve возвращает только retrieved_chunks, остальные поля остаются без изменений.
Узел generate добавляет новое сообщение в messages и записывает промежуточный ответ.
Редьюсер add_messages гарантирует, что история не перезаписывается, а дополняется.

7. Сравнение фреймворков для передачи состояния

Фреймворк	Механизм состояния	Особенности
LangGraph	TypedDict + редьюсеры	Встроенный граф, чекпоинты, поддержка параллельных веток
CrewAI	Внутренний контекст (через `Task` и `Agent`)	Состояние неявное, передаётся через результаты задач
AutoGen	`ConversableAgent` с внутренним `_context`	Требуется ручное управление, можно подключать внешние хранилища
Semantic Kernel	`ContextVariables`	Простой словарь, нет редьюсеров, подходит для простых сценариев

Вывод для сложных Agentic RAG-систем с многошаговыми рассуждениями LangGraph — наиболее гибкий и контролируемый вариант.

8. Пет-проект для закрепления

Задача Реализовать агента, который отвечает на вопросы по документации LangChain, используя многошаговый поиск и проверку фактов.

Инструменты Python, LangGraph, LangChain, ChromaDB (векторное хранилище), OpenAI API.

Шаги:

Загрузить документацию LangChain (например, несколько страниц) и разбить на чанки.
Создать эмбеддинги и индекс в ChromaDB.
Определить состояние агента с полями: messages, retrieved_chunks, verified_claims, confidence.
Построить граф из узлов:
- retrieve — поиск top-3 чанков.
- verify — LLM проверяет, достаточно ли информации; если нет — возвращает need_more.
- generate — формирует финальный ответ.
Добавить условное ребро: если verify вернул need_more, перейти к узлу refine_query (переформулировка запроса) и затем снова к retrieve.
Реализовать чекпоинты (сохранение состояния после каждого шага) для отладки.
Протестировать на вопросах разной сложности.

Ожидаемый результат Рабочий агент, который может самостоятельно уточнять запрос, если первого поиска недостаточно. Состояние логируется в файл для анализа.

9. Связь с другими вопросами

Вопрос	Тема
140	Как спроектировать граф агента?
141	Какие инструменты (tools) вы используете в агентах?
142	Как обрабатывать ошибки в цепочке вызовов?
143	Как организовать память агента (long-term memory)?
145	Как тестировать агентные системы?
146	Как обеспечить отказоустойчивость агента?

10. Навигация

Предыдущий: 143
Следующий: 145
Индекс: 00. Индекс разборов