ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Агент с delegated tools (Supervisor → 2 специализированных агента)

1. Цель задачи

Спроектировать и реализовать агентную систему с одним супервизором (Supervisor) и двумя специализированными агентами, каждый из которых владеет определённым набором инструментов. Supervisor получает сложную задачу, разбивает её на подзадачи и делегирует выполнение подходящему агенту. Цель: на практике освоить паттерн «оркестратор+воркеры», понять, как управлять контекстом и распределять вызовы LLM между агентами.

Ключевой результат Работающее консольное приложение, в котором произвольная сложная задача (состоящая из нескольких разных типов действий) решается путём последовательного вызова двух специализированных агентов через supervisor.

2. Исходные данные

Что нужно	Откуда взять
Python 3.11+	Установить из официального дистрибутива
LLM API (OpenAI / Anthropic / локальная модель)	API-ключ (OpenAI), либо запустить Ollama с моделями (например, llama3)
Фреймворк для агентов (LangGraph / CrewAI / Autogen)	`pip install langgraph`, `pip install crewai`, или аналоги
Инструменты для специализированных агентов	Набор: веб-поиск (Mock/заглушка), калькулятор, преобразование текста, работа с файлами – см. ниже

Если нет реального инструмента — симулируем:

Для веб-поиска: создать класс MockWebSearch с фиксированными ответами по заданным запросам.
Для API вызовов (погода, курсы валют): написать заглушки, возвращающие заранее заготовленные JSON-объекты.
Для доступа к файлам: использовать tempfile и создать иерархию тестовых файлов во временной папке.

3. Технологический стек

Компонент	Инструменты	Назначение
Язык программирования	Python 3.11+	Реализация всей системы
Управление диалогами	LangGraph (граф состояний)	Построение графа агентов и состояния
LLM	OpenAI GPT-4o / Anthropic Claude 3.5 Sonnet / Ollama llama3	Генерация ответов, принятие решений
Инструменты агентов	`duckduckgo_search`, `wolframalpha`, `yfinance`, `requests`	Фактические инструменты (или моки)
Хранение состояния	Словарь Python / `langgraph.graph.State`	Сохранение истории вызовов и контекста
Логирование	`logging` (INFO для трейсинга)	Отладка и анализ
Тестирование	`pytest` + `unittest.mock`	Проверка логики делегирования

4. Этапы выполнения

Этап 1: Проектирование архитектуры и выбор доменной области (1–2 ч)

Действия

Выбрать предметную область, например:
- «Финансовый ассистент» (агент A получает рыночные данные, агент B делает анализ и отчёт).
- «Путеводитель» (агент A ищет достопримечательности, агент B – маршруты и бронирование).
- «Научный ревью» (агент A ищет статьи, агент B пишет аннотацию).
Определить два специализированных агента
- Агент Alpha — отвечает за сбор информации (инструменты: web search, API погоды/финансов, чтение файлов).
- Агент Beta — отвечает за обработку и генерацию (инструменты: калькулятор, перевод, форматирование, запись в файл).
Спроектировать граф состояний в LangGraph:
- Узлы supervisor_node, agent_alpha_node, agent_beta_node, human_node (если нужна обратная связь).
- Рёбра Supervisor → Alpha (если запрос на сбор данных), Supervisor → Beta (если запрос на обработку), Alpha → Supervisor, Beta → Supervisor.
- Состояние messages (список сообщений), task_plan (план, сгенерированный supervisor), results (собранные данные).

Нарисовать диаграмму (в текстовом виде или в Mermaid):

graph TD
    A[Supervisor] -->|delegate search| B[Alpha Agent]
    A -->|delegate compute| C[Beta Agent]
    B --> A
    C --> A
    A -->|final answer| D[User]

Ожидаемый результат этапа Описание архитектуры, выбор доменной области, структура графа в виде кода на LangGraph.

Этап 2: Реализация специализированных агентов и их инструментов (2–3 ч)

Действия

Создать классы инструментов
- web_search(query: str) -> str — мок, возвращает фиктивные результаты.
- read_file(path: str) -> str — читает локальный файл.
- calculator(expression: str) -> float — использует eval с безопасным окружением (или numexpr).
- translate(text: str, target_lang: str) -> str — мок (пишет [переведено: {text} -> {lang}]).
Реализовать агента Alpha
- Функция agent_alpha_node(state: State) -> State:
  - Принимает задачу от supervisor.
  - Вызывает подходящий инструмент (по ключевым словам).
  - Возвращает результат в состояние.
- Использовать @tool из LangChain, если используем langgraph с привязкой инструментов.
Пример кода:
```
from langchain_core.tools import tool

@tool
def web_search(query: str) -> str:
    """Поиск информации по запросу."""
    return f"Mock result for '{query}': some relevant data."

agent_alpha = create_openai_functions_agent(llm, [web_search, read_file])
```
Реализовать агента Beta
- Аналогично, но с инструментами: calculator, translate, write_file.
- write_file(path, content) — записывает в файл и возвращает подтверждение.
Протестировать каждого агента изолированно — передать простой запрос и убедиться, что инструмент вызывается корректно.

Ожидаемый результат этапа Два работающих агента, каждый может выполнить свою подзадачу в изоляции.

Этап 3: Реализация Supervisor-агента с логикой делегирования (2–3 ч)

Действия

Написать системный промпт для supervisor

Ты – руководитель команды из двух агентов: Alpha (сбор информации) и Beta (обработка/создание).
Проанализируй запрос пользователя, разбей на подзадачи и для каждой реши, какой агент должен её выполнить.
Отвечай в строгом формате JSON:
{
    "next_agent": "Alpha" | "Beta",
    "task": "детальное описание задачи для агента",
    "context": "контекст, который нужно передать агенту"
}
Если задача завершена, ответь {"next_agent": "FINISH", "final_answer": "..."}.

Реализовать узел supervisor_node
- Вызывать LLM с системным промптом и историей сообщений.
- Парсить JSON-ответ, записывать в состояние: state["next_agent"] и state["pending_tasks"].
Реализовать роутинг (логику, какой узел выполнить следующим):
- В графе после supervisor проверяем state["next_agent"]:
  - если "Alpha" → переходим к agent_alpha_node.
  - если "Beta" → переходим к agent_beta_node.
  - если "FINISH" → выводим финальный ответ и завершаем диалог.
Добавить цикл После каждого специализированного агента возвращаем управление supervisor, чтобы он мог продолжить или завершить.
Обработать ошибки десериализации (если LLM вернула невалидный JSON) — повторить запрос с инструкцией исправить.

Ожидаемый результат этапа Полный граф, по которому проходит запрос: supervisor → Alpha → supervisor → Beta → supervisor → ответ.

Этап 4: Интеграция, тестирование и демонстрация (1–2 ч)

Действия

Написать несколько тестовых сценариев (минимум 3):
- Сценарий 1: «Найди последние новости по теме X и переведи их на испанский». Требует Alpha (поиск) → Beta (перевод).
- Сценарий 2: «Посчитай сумму 1234 + 5678, а затем результат запиши в файл results.txt». Требует Beta (калькулятор + запись).
- Сценарий 3: «Подготовь отчёт: найди данные о погоде в Лондоне и сформируй краткое резюме». Alpha (поиск) → Beta (генерация текста).
Запустить систему в интерактивном режиме (цикл while с вводом пользователя).
Вывести трейс вызовов инструментов и решений supervisor (используя логирование).
Убедиться, что сложная задача действительно решается (все подзадачи выполняются последовательно).

Ожидаемый результат этапа Демонстрация, где supervisor корректно делегирует задачи, а агенты возвращают осмысленные результаты.

Этап 5: Документирование и оформление (0.5–1 ч)

Действия

Написать README.md с инструкцией по запуску, примером использования и описанием архитектуры.
Приложить диаграмму графа (Mermaid) в README.
Добавить файл requirements.txt / pyproject.toml.

Ожидаемый результат этапа Готовый репозиторий, понятный новому разработчику.

5. Критерии приемки (Definition of Done)

Система запускается одной командой (например, python main.py) и принимает запросы через консоль.
Supervisor корректно разбивает сложный запрос на подзадачи.
Каждый агент вызывает свои инструменты и возвращает результат supervisor.
Supervisor передаёт контекст (предыдущие результаты) следующему агенту.
Поток управления соответствует спроектированному графу (логируется).
Реализованы минимум два разных инструмента у каждого агента.
Система успешно проходит все три тестовых сценария.
Код покрыт юнит-тестами (pytest) на уровне инструментов и логики делегирования.
Добавлена обработка ошибок: невалидный JSON от LLM, недоступность инструмента, пустой ответ агента.

6. Ожидаемый результат

Основной файл main.py – точка входа с графом LangGraph и циклом диалога.
Дополнительные файлы
- agents.py – реализация агентов Alpha и Beta.
- tools.py – все инструменты (реальные или моки).
- state.py – определение состояния графа.
- prompts.py – системные промпты.
- test_agents.py – тесты.
- README.md с документацией.
Содержимое полноценная multi-agent система, демонстрирующая паттерн delegated tools.

7. Возможные сложности и их решение

Сложность	Решение
LLM не соблюдает формат JSON в ответе supervisor	Добавить few-shot примеры в промпт, а при ошибке парсинга переспрашивать (retry до 3 раз)
Бесконечный цикл: supervisor постоянно передаёт задачу одному агенту	Ввести счётчик итераций (max_delegations), после которого принудительно завершать
Агент не распознаёт, какой инструмент использовать	Уточнить описание инструмента в `@tool` и добавить fallback-запрос к LLM
Моки не дают реалистичного поведения	Написать моки с динамической генерацией на основе шаблонов, чтобы тесты были разнообразны
Путаница в состоянии (результаты теряются)	Чётко определить ключи в `State` (`collected_data`, `processed_data`, `pending_tasks`)

8. Бюджет времени (оценка)

Этап	Время
1. Проектирование архитектуры	1.5 ч
2. Реализация инструментов и агентов	2.5 ч
3. Реализация Supervisor	2.5 ч
4. Интеграция, тестирование	2 ч
5. Документирование	0.5 ч
Итого	9 ч

Примечание Для первого раза рекомендуется заложить 2–3 дополнительных часа на отладку и исправление ошибок, характерных для multi-agent систем.

9. Связанные вопросы из базы знаний

Вопрос	Тема
101	Архитектура RAG-системы с несколькими индексами
205	Использование LangGraph для пошаговых цепочек
310	Паттерн “Orchestrator-Workers” в AI-системах
412	Динамическое добавление инструментов в агент
508	Управление контекстом в long-running агентах
623	Валидация JSON-ответов от LLM (structured output)
734	Обработка ошибок в графах LangGraph (fallback)
845	Тестирование моков инструментов в агентных системах
889	Деплой multi-agent приложений в Docker

10. Чек-лист самопроверки

Я разделил обязанности агентов так, чтобы каждый отвечал за один тип действий (сбор vs обработка).
Supervisor всегда анализирует запрос перед делегированием, а не просто передаёт всё первому агенту.
В коде реализована защита от зацикливания (максимум 5 делегирований).
Я написал минимум один end-to-end тест, который проходит от запроса до финального ответа.
README содержит пример запуска и один реальный кейс использования.

ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Агент с delegated tools (Supervisor → 2 специализированных агента)

1. Цель задачи

2. Исходные данные

Что нужно	Откуда взять
Python 3.11+	Установить из официального дистрибутива
LLM API (OpenAI / Anthropic / локальная модель)	API-ключ (OpenAI), либо запустить Ollama с моделями (например, llama3)
Фреймворк для агентов (LangGraph / CrewAI / Autogen)	`pip install langgraph`, `pip install crewai`, или аналоги
Инструменты для специализированных агентов	Набор: веб-поиск (Mock/заглушка), калькулятор, преобразование текста, работа с файлами – см. ниже

Если нет реального инструмента — симулируем:

Для веб-поиска: создать класс MockWebSearch с фиксированными ответами по заданным запросам.
Для API вызовов (погода, курсы валют): написать заглушки, возвращающие заранее заготовленные JSON-объекты.
Для доступа к файлам: использовать tempfile и создать иерархию тестовых файлов во временной папке.

3. Технологический стек

Компонент	Инструменты	Назначение
Язык программирования	Python 3.11+	Реализация всей системы
Управление диалогами	LangGraph (граф состояний)	Построение графа агентов и состояния
LLM	OpenAI GPT-4o / Anthropic Claude 3.5 Sonnet / Ollama llama3	Генерация ответов, принятие решений
Инструменты агентов	`duckduckgo_search`, `wolframalpha`, `yfinance`, `requests`	Фактические инструменты (или моки)
Хранение состояния	Словарь Python / `langgraph.graph.State`	Сохранение истории вызовов и контекста
Логирование	`logging` (INFO для трейсинга)	Отладка и анализ
Тестирование	`pytest` + `unittest.mock`	Проверка логики делегирования

4. Этапы выполнения

Этап 1: Проектирование архитектуры и выбор доменной области (1–2 ч)

Действия

Выбрать предметную область, например:
- «Финансовый ассистент» (агент A получает рыночные данные, агент B делает анализ и отчёт).
- «Путеводитель» (агент A ищет достопримечательности, агент B – маршруты и бронирование).
- «Научный ревью» (агент A ищет статьи, агент B пишет аннотацию).
Определить два специализированных агента
- Агент Alpha — отвечает за сбор информации (инструменты: web search, API погоды/финансов, чтение файлов).
- Агент Beta — отвечает за обработку и генерацию (инструменты: калькулятор, перевод, форматирование, запись в файл).
Спроектировать граф состояний в LangGraph:
- Узлы supervisor_node, agent_alpha_node, agent_beta_node, human_node (если нужна обратная связь).
- Рёбра Supervisor → Alpha (если запрос на сбор данных), Supervisor → Beta (если запрос на обработку), Alpha → Supervisor, Beta → Supervisor.
- Состояние messages (список сообщений), task_plan (план, сгенерированный supervisor), results (собранные данные).

Нарисовать диаграмму (в текстовом виде или в Mermaid):

graph TD
    A[Supervisor] -->|delegate search| B[Alpha Agent]
    A -->|delegate compute| C[Beta Agent]
    B --> A
    C --> A
    A -->|final answer| D[User]

Этап 2: Реализация специализированных агентов и их инструментов (2–3 ч)

Действия

Создать классы инструментов
- web_search(query: str) -> str — мок, возвращает фиктивные результаты.
- read_file(path: str) -> str — читает локальный файл.
- calculator(expression: str) -> float — использует eval с безопасным окружением (или numexpr).
- translate(text: str, target_lang: str) -> str — мок (пишет [переведено: {text} -> {lang}]).
Реализовать агента Alpha
- Функция agent_alpha_node(state: State) -> State:
  - Принимает задачу от supervisor.
  - Вызывает подходящий инструмент (по ключевым словам).
  - Возвращает результат в состояние.
- Использовать @tool из LangChain, если используем langgraph с привязкой инструментов.
Пример кода:
```
from langchain_core.tools import tool

@tool
def web_search(query: str) -> str:
    """Поиск информации по запросу."""
    return f"Mock result for '{query}': some relevant data."

agent_alpha = create_openai_functions_agent(llm, [web_search, read_file])
```
Реализовать агента Beta
- Аналогично, но с инструментами: calculator, translate, write_file.
- write_file(path, content) — записывает в файл и возвращает подтверждение.
Протестировать каждого агента изолированно — передать простой запрос и убедиться, что инструмент вызывается корректно.

Ожидаемый результат этапа Два работающих агента, каждый может выполнить свою подзадачу в изоляции.

Этап 3: Реализация Supervisor-агента с логикой делегирования (2–3 ч)

Действия

Написать системный промпт для supervisor

Ты – руководитель команды из двух агентов: Alpha (сбор информации) и Beta (обработка/создание).
Проанализируй запрос пользователя, разбей на подзадачи и для каждой реши, какой агент должен её выполнить.
Отвечай в строгом формате JSON:
{
    "next_agent": "Alpha" | "Beta",
    "task": "детальное описание задачи для агента",
    "context": "контекст, который нужно передать агенту"
}
Если задача завершена, ответь {"next_agent": "FINISH", "final_answer": "..."}.

Реализовать узел supervisor_node
- Вызывать LLM с системным промптом и историей сообщений.
- Парсить JSON-ответ, записывать в состояние: state["next_agent"] и state["pending_tasks"].
Реализовать роутинг (логику, какой узел выполнить следующим):
- В графе после supervisor проверяем state["next_agent"]:
  - если "Alpha" → переходим к agent_alpha_node.
  - если "Beta" → переходим к agent_beta_node.
  - если "FINISH" → выводим финальный ответ и завершаем диалог.
Добавить цикл После каждого специализированного агента возвращаем управление supervisor, чтобы он мог продолжить или завершить.
Обработать ошибки десериализации (если LLM вернула невалидный JSON) — повторить запрос с инструкцией исправить.

Этап 4: Интеграция, тестирование и демонстрация (1–2 ч)

Действия

Написать несколько тестовых сценариев (минимум 3):
- Сценарий 1: «Найди последние новости по теме X и переведи их на испанский». Требует Alpha (поиск) → Beta (перевод).
- Сценарий 2: «Посчитай сумму 1234 + 5678, а затем результат запиши в файл results.txt». Требует Beta (калькулятор + запись).
- Сценарий 3: «Подготовь отчёт: найди данные о погоде в Лондоне и сформируй краткое резюме». Alpha (поиск) → Beta (генерация текста).
Запустить систему в интерактивном режиме (цикл while с вводом пользователя).
Вывести трейс вызовов инструментов и решений supervisor (используя логирование).
Убедиться, что сложная задача действительно решается (все подзадачи выполняются последовательно).

Этап 5: Документирование и оформление (0.5–1 ч)

Действия

Написать README.md с инструкцией по запуску, примером использования и описанием архитектуры.
Приложить диаграмму графа (Mermaid) в README.
Добавить файл requirements.txt / pyproject.toml.

Ожидаемый результат этапа Готовый репозиторий, понятный новому разработчику.

5. Критерии приемки (Definition of Done)

Система запускается одной командой (например, python main.py) и принимает запросы через консоль.
Supervisor корректно разбивает сложный запрос на подзадачи.
Каждый агент вызывает свои инструменты и возвращает результат supervisor.
Supervisor передаёт контекст (предыдущие результаты) следующему агенту.
Поток управления соответствует спроектированному графу (логируется).
Реализованы минимум два разных инструмента у каждого агента.
Система успешно проходит все три тестовых сценария.
Код покрыт юнит-тестами (pytest) на уровне инструментов и логики делегирования.
Добавлена обработка ошибок: невалидный JSON от LLM, недоступность инструмента, пустой ответ агента.

6. Ожидаемый результат

Основной файл main.py – точка входа с графом LangGraph и циклом диалога.
Дополнительные файлы
- agents.py – реализация агентов Alpha и Beta.
- tools.py – все инструменты (реальные или моки).
- state.py – определение состояния графа.
- prompts.py – системные промпты.
- test_agents.py – тесты.
- README.md с документацией.
Содержимое полноценная multi-agent система, демонстрирующая паттерн delegated tools.

7. Возможные сложности и их решение

Сложность	Решение
LLM не соблюдает формат JSON в ответе supervisor	Добавить few-shot примеры в промпт, а при ошибке парсинга переспрашивать (retry до 3 раз)
Бесконечный цикл: supervisor постоянно передаёт задачу одному агенту	Ввести счётчик итераций (max_delegations), после которого принудительно завершать
Агент не распознаёт, какой инструмент использовать	Уточнить описание инструмента в `@tool` и добавить fallback-запрос к LLM
Моки не дают реалистичного поведения	Написать моки с динамической генерацией на основе шаблонов, чтобы тесты были разнообразны
Путаница в состоянии (результаты теряются)	Чётко определить ключи в `State` (`collected_data`, `processed_data`, `pending_tasks`)

8. Бюджет времени (оценка)

Этап	Время
1. Проектирование архитектуры	1.5 ч
2. Реализация инструментов и агентов	2.5 ч
3. Реализация Supervisor	2.5 ч
4. Интеграция, тестирование	2 ч
5. Документирование	0.5 ч
Итого	9 ч

9. Связанные вопросы из базы знаний

Вопрос	Тема
101	Архитектура RAG-системы с несколькими индексами
205	Использование LangGraph для пошаговых цепочек
310	Паттерн “Orchestrator-Workers” в AI-системах
412	Динамическое добавление инструментов в агент
508	Управление контекстом в long-running агентах
623	Валидация JSON-ответов от LLM (structured output)
734	Обработка ошибок в графах LangGraph (fallback)
845	Тестирование моков инструментов в агентных системах
889	Деплой multi-agent приложений в Docker

10. Чек-лист самопроверки

Я разделил обязанности агентов так, чтобы каждый отвечал за один тип действий (сбор vs обработка).
Supervisor всегда анализирует запрос перед делегированием, а не просто передаёт всё первому агенту.
В коде реализована защита от зацикливания (максимум 5 делегирований).
Я написал минимум один end-to-end тест, который проходит от запроса до финального ответа.
README содержит пример запуска и один реальный кейс использования.