Что такое skill libraries для агентов и как их создавать?

Q: 1. Термин: Skill library (библиотека навыков)

*[[Вики/skill library\|Skill library]]* — это структурированное хранилище многократно используемых процедур, каждая из которых объединяет несколько вызовов инструментов, логику принятия решений и форматирование результата. В контексте [[Вики/Agentic AI\|Agentic AI]] (агентного ИИ) [[Вики/skill\|skill]] — это атомарная [[Вики/Span\|единица работы]], которую [[Вики/AI agents\|агент]] может запросить по имени.

Q: 2. Зачем нужны skill libraries?

| Проблема без skill library | Решение с skill library | |---------------------------|--------------------------| | Агент делает 10+ вызовов для типовой задачи → latency, ошибки, высокая стоимость | Один вызов skill → быстрее, дешевле, надёжнее | | Логика размазана по трассе каждого сеанса → трудно отлаживать | Skill — единая точка изменений и тестирования |

Q: 3. Отличие skill'ов от обычных функций и инструментов

| Аспект | Инструмент (tool) | Skill (навык) | |--------|------------------|---------------| | Сложность | Одно атомарное действие (поиск, отправка email, калк) | Композиция >1 инструмента + логика | | Состояние | Не хранит контекст | Может использовать контекст предыдущих шагов |

Q: 4. Этап 1: Анализ логов агента и выявление частых паттернов

Начало создания библиотеки — data-driven подход. Берём [[Вики/logs\|логи]] предыдущих сессий агента (или прототипа) и ищем [[Вики/цепочки\|цепочки вызовов]], которые повторяются. Методы анализа - [[Вики/Sequence mining\|Sequence mining]]: алгоритмы вроде [[Вики/SPADE\|SPADE]], [[Вики/PrefixSpan\|PrefixSpan]] на последовательностях вызовов инструментов.

Q: 5. Этап 2: Проектирование интерфейса skill'а

class SkillInterface: name: str # уникальное имя, например "send_report_to_manager" description: str # описание для агента (промпт) input_schema: dict # JSON Schema для входных параметров output_schema: dict # JSON Schema для выходных данных required_tools: list[str] # список инструментов, которые skill использует

Q: 6. Этап 3: Реализация skill'а в коде

from typing import Dict, Any class SendReportSkill: def __init__(self, tools: Dict[str, Any]): self.search = tools["search_database"] self.llm = tools["llm_generate"] self.email = tools["send_email_api"] async def execute(self, period: str, manager_email: str) -> Dict[str, Any]: # 1. Поиск данных

Q: 7. Этап 4: Регистрация skill'а в библиотеке и обучение агента

Регистрация: каждый [[Вики/skill\|skill]] добавляется в центральный [[Вики/Registry\|реестр]] — словарь или базу данных, к которой [[Вики/agent\|агент]] обращается во [[Вики/Execution time\|время выполнения]]. Пример простого реестра: from typing import Dict, Type, Any class SkillRegistry:

Q: 8. Примеры конкретных skill'ов

| Skill | Композиция | Input | Output | |-------|-----------|-------|--------| | `send_report_to_manager` | search + llm + email | period, email | статус, id письма | | `summarize_conversation` | fetch transcript + llm | conversation_id | краткое содержание | | `resolve_customer_complaint` | search ticket + llm + update_ticket | ticket_id | разрешённый тикет |

Краткий тезис

Skill library — это коллекция переиспользуемых навыков (skill’ов), которые AI-агент может вызывать как единое целое для выполнения сложных составных действий. Создание включает анализ логов агента на предмет частых паттернов, проектирование чёткого интерфейса (вход/выход) для каждого паттерна, реализацию в виде вызываемых функций и обучение агента их использованию через few-shot или fine-tuning. Skill libraries радикально сокращают количество шагов агента (например, с 10 до 1) и повышают надёжность, так как вместо цепочки вызовов инструментов агент обращается к одному проверенному навыку.

1. Термин: Skill library (библиотека навыков)

Skill library — это структурированное хранилище многократно используемых процедур, каждая из которых объединяет несколько вызовов инструментов, логику принятия решений и форматирование результата. В контексте Agentic AI (агентного ИИ) skill — это атомарная единица работы, которую агент может запросить по имени.

Пример: skill send_report_to_manager может внутри себя:

выполнить search (поиск по БД или векторному хранилищу)
вызвать LLM для генерации краткого содержания
отправить письмо через email API
вернуть подтверждение агенту.

В отличие от отдельного инструмента (например, просто send_email), skill — это композиция шагов, имеющая единый контракт: на вход — параметры (например, тема, период), на выход — структурированный ответ (успех/ошибка, данные).

2. Зачем нужны skill libraries?

Проблема без skill library	Решение с skill library
Агент делает 10+ вызовов для типовой задачи → latency, ошибки, высокая стоимость	Один вызов skill → быстрее, дешевле, надёжнее
Логика размазана по трассе каждого сеанса → трудно отлаживать	Skill — единая точка изменений и тестирования
При изменении workflow нужно переучивать агент или править промпт	Достаточно обновить код skill'а, интерфейс остаётся тем же
Каждый новый инженер пишет свою цепочку заново	Skill library — shared knowledge base команды

Skill libraries также позволяют изолировать ответственность: разработчик, знающий Python и API, пишет skill, а инженер промптов учит агента вызывать его.

3. Отличие skill'ов от обычных функций и инструментов

Аспект	Инструмент (tool)	Skill (навык)
Сложность	Одно атомарное действие (поиск, отправка email, калк)	Композиция >1 инструмента + логика
Состояние	Не хранит контекст	Может использовать контекст предыдущих шагов
Интерфейс	Простой: функция(input) → output	Расширенный: может включать meta, fallback, retry
Цель	Предоставить низкоуровневую возможность	Решить бизнес-задачу целиком
Тестирование	Unit-тест на корректность вызова	Интеграционные сценарии, имитация ошибок

Skill можно рассматривать как мета-инструмент, который оркестрирует другие инструменты.

4. Этап 1: Анализ логов агента и выявление частых паттернов

Начало создания библиотеки — data-driven подход. Берём логи предыдущих сессий агента (или прототипа) и ищем цепочки вызовов, которые повторяются.

Методы анализа

Sequence mining: алгоритмы вроде SPADE, PrefixSpan на последовательностях вызовов инструментов.
Кластеризация Embedding'ов: эмбеддим каждую трассу (последовательность названий/параметров) и кластеризуем. Типичный кластер → потенциальный skill.
Ручной аудит (если логов мало): разбираем 10–20 диалогов, выписываем повторяющиеся сценарии.

Пример: в логах заметили, что агент всегда после поиска данных зовёт format_report, затем send_email. Паттерн search → format → email встречается >50 раз. Это кандидат на skill send_report_to_manager.

Критерии отбора:

Частота: >5% от всех сессий.
Стабильность: последовательность редко меняется.
Бизнес-ценность: паттерн приносит пользу пользователю.

5. Этап 2: Проектирование интерфейса skill'а

Интерфейс должен быть чётким и включать:

class SkillInterface:
    name: str           # уникальное имя, например "send_report_to_manager"
    description: str    # описание для агента (промпт)
    input_schema: dict  # JSON Schema для входных параметров
    output_schema: dict # JSON Schema для выходных данных
    required_tools: list[str]  # список инструментов, которые skill использует

Пример для skill send_report_to_manager

{
  "name": "send_report_to_manager",
  "description": "Генерирует отчёт по ключевым показателям за указанный период и отправляет его на email менеджеру. Параметры: period (str), manager_email (str).",
  "input_schema": {
    "type": "object",
    "properties": {
      "period": {"type": "string", "enum": ["day", "week", "month"]},
      "manager_email": {"type": "string", "format": "email"}
    },
    "required": ["period", "manager_email"]
  },
  "output_schema": {
    "type": "object",
    "properties": {
      "status": {"type": "string"},
      "email_id": {"type": "string"}
    },
    "required": ["status"]
  },
  "required_tools": ["search_database", "llm_generate", "send_email_api"]
}

Важные принципы:

Fail early: skill должен проверять входные параметры и выдавать понятную ошибку.
Graceful degradation: если один из внутренних инструментов падает, skill может использовать fallback (например, кеш или другой API).
Документация в description должна быть достаточной, чтобы LLM-агент понял, когда его вызывать.

6. Этап 3: Реализация skill'а в коде

Skill — это класс или функция, которая использует предоставленные инструменты (они инжектятся через Dependency Injection).

from typing import Dict, Any

class SendReportSkill:
    def __init__(self, tools: Dict[str, Any]):
        self.search = tools["search_database"]
        self.llm = tools["llm_generate"]
        self.email = tools["send_email_api"]
    
    async def execute(self, period: str, manager_email: str) -> Dict[str, Any]:
        # 1. Поиск данных
        raw_data = await self.search(query=f"kpi for {period}")
        # 2. Генерация отчёта
        report = await self.llm(prompt=f"Сделай краткий отчёт: {raw_data}")
        # 3. Отправка
        email_id = await self.email(to=manager_email, body=report)
        return {"status": "success", "email_id": email_id}

Skill должен быть stateless (или использовать контекст только через явно переданный session_id) для простоты повторного использования.

7. Этап 4: Регистрация skill'а в библиотеке и обучение агента

Регистрация: каждый skill добавляется в центральный реестр — словарь или базу данных, к которой агент обращается во время выполнения.

Пример простого реестра:

from typing import Dict, Type, Any

class SkillRegistry:
    def __init__(self):
        self._skills: Dict[str, Type] = {}
    
    def register(self, skill: Type, interface: dict):
        name = interface["name"]
        self._skills[name] = {"class": skill, "interface": interface}
    
    def get_skill(self, name: str) -> dict:
        return self._skills.get(name)

Обучение агента использовать skill:

Few-shot: добавляем в системный промпт примеры использования skill'ов. Агент понимает, когда вызвать send_report_to_manager, а когда search_billing_info.
Fine-tuning: дообучаем LLM на датасете (запрос → правильный вызов skill). Особенно полезно, если библиотека большая (100+ скиллов).
RL (Reinforcement Learning): агент пробует разные скиллы, получает награду за успешное завершение задачи. Популярные скиллы закрепляются.

Важно: skill library должна быть динамической — агент может получать скиллы через retrieval (RAG the skills) или через планировщик, который решает, какой skill выполнить.

8. Примеры конкретных skill'ов

Skill	Композиция	Input	Output
`send_report_to_manager`	search + llm + email	period, email	статус, id письма
`summarize_conversation`	fetch transcript + llm	conversation_id	краткое содержание
`resolve_customer_complaint`	search ticket + llm + update_ticket	ticket_id	разрешённый тикет
`generate_invoice`	search orders + llm + pdf_gen	customer_id, month	PDF + ссылка
`schedule_meeting`	search calendar + llm + send_invite	participants, topic	статус, ссылка

Каждый skill уменьшает когнитивную нагрузку на агента: вместо 5 шагов он делает 1.

9. Метрики эффективности skill библиотеки

Чтобы понять, что skill работает хорошо, используем:

Skill success rate: доля выполнений, завершившихся без ошибки. Цель >95%.
Skill adoption rate: как часто агент выбирает этот skill из библиотеки. Низкий adoption → skill бесполезен или плохо описан.
Average time per task: время выполнения задачи раньше vs с использованием skill.
User satisfaction: через обратную связь (lime/dislike).

Mониторинг:

Логируем каждый вызов skill: вход, трассировка, выход, время.
Alert при падении success rate ниже порога.

10. Жизненный цикл skill'а

Propose (предложение): на основе логов или запроса бизнеса.
Design (дизайн): интерфейс, согласование с командой.
Implement (реализация): код, тесты (unit + integration).
Register (регистрация): добавление в реестр, обновление документации.
Train (обучение агента): few-shot / fine-tune / RL.
Deploy (развёртывание): в staging → тестирование A/B → production.
Monitor (мониторинг): метрики.
Update / Retire (обновление/удаление): если skill перестал быть нужен, его помечают deprecated или удаляют.

11. Инструменты для управления библиотеками

LangChain Hub: можно публиковать и версионировать chain'ы (по сути скиллы) на центральном хабе.
Custom Skill Registry: реализуется на FastAPI + PostgreSQL, с веб-интерфейсом для просмотра и тестирования.
Semantic Kernel (Microsoft): концепция "plugins", аналог skill'ов.
CrewAI / AutoGen: библиотеки для многоагентных систем, где skill — это роль или задача.

12. Связь с Agentic RAG и multi-agent системами

В Agentic RAG skill'и могут включать retrieval + генерацию — это естественный способ упаковать RAG пайплайн в один вызов. Например, skill answer_with_rag внутри использует поиск по векторной БД, формирование промпта, генерацию ответа и проверку фактов.

В multi-agent системах skill library становится общим языком: один агент (планировщик) может делегировать задачу другому через вызов skill'а. Это упрощает взаимодействие: не нужно, чтобы агенты знали внутренние инструменты друг друга.

Пет-проект для закрепления

Задача: Создайте простую skill library для агента-помощника, который может:

искать информацию по продукту (search_product),
генерировать краткое описание (generate_description),
отправлять описание по email (send_email).

Объедините их в skill product_brief_to_manager.

Инструменты:

Python (asyncio)
Фейковые API (Mock инструменты: эмулировать поиск, генерацию, email)
Простой LLM для тестирования: OpenAI API (или локальная модель через Ollama)
Реестр словаря

Шаги:

Создайте интерфейсы для трёх инструментов.
Напишите класс ProductBriefSkill, композирующий их.
Реализуйте SkillRegistry и зарегистрируйте skill.
Напишите скрипт, который принимает запрос пользователя и решает, какой skill вызывать (можно через LLM с few-shot промптом).
Вызовите skill для проверки.

Ожидаемый результат: агент по запросу "отправь brief по продукту XYZ менеджеру a@b.com" выполняет skill product_brief_to_manager, который за 1 шаг делает поиск, генерацию и отправку. В логах видно, что шагов стало 3 → 1.

Связь с другими вопросами

Вопрос	Тема
571	Что такое AI-агенты и чем они отличаются от обычных LLM?
572	Какие компоненты входят в архитектуру агента?
573	Как агент выбирает, какой инструмент вызвать?
574	Что такое планирование (planning) в агентах и как оно работает?
575	Какие стратегии рефлексии (self-reflection) существуют для агентов?
577	Как вы тестируете и отлаживаете агентов?

Краткий тезис

1. Термин: Skill library (библиотека навыков)

Пример: skill send_report_to_manager может внутри себя:

выполнить search (поиск по БД или векторному хранилищу)
вызвать LLM для генерации краткого содержания
отправить письмо через email API
вернуть подтверждение агенту.

2. Зачем нужны skill libraries?

Проблема без skill library	Решение с skill library
Агент делает 10+ вызовов для типовой задачи → latency, ошибки, высокая стоимость	Один вызов skill → быстрее, дешевле, надёжнее
Логика размазана по трассе каждого сеанса → трудно отлаживать	Skill — единая точка изменений и тестирования
При изменении workflow нужно переучивать агент или править промпт	Достаточно обновить код skill'а, интерфейс остаётся тем же
Каждый новый инженер пишет свою цепочку заново	Skill library — shared knowledge base команды

3. Отличие skill'ов от обычных функций и инструментов

Аспект	Инструмент (tool)	Skill (навык)
Сложность	Одно атомарное действие (поиск, отправка email, калк)	Композиция >1 инструмента + логика
Состояние	Не хранит контекст	Может использовать контекст предыдущих шагов
Интерфейс	Простой: функция(input) → output	Расширенный: может включать meta, fallback, retry
Цель	Предоставить низкоуровневую возможность	Решить бизнес-задачу целиком
Тестирование	Unit-тест на корректность вызова	Интеграционные сценарии, имитация ошибок

Skill можно рассматривать как мета-инструмент, который оркестрирует другие инструменты.

4. Этап 1: Анализ логов агента и выявление частых паттернов

Методы анализа

Sequence mining: алгоритмы вроде SPADE, PrefixSpan на последовательностях вызовов инструментов.
Кластеризация Embedding'ов: эмбеддим каждую трассу (последовательность названий/параметров) и кластеризуем. Типичный кластер → потенциальный skill.
Ручной аудит (если логов мало): разбираем 10–20 диалогов, выписываем повторяющиеся сценарии.

Критерии отбора:

Частота: >5% от всех сессий.
Стабильность: последовательность редко меняется.
Бизнес-ценность: паттерн приносит пользу пользователю.

5. Этап 2: Проектирование интерфейса skill'а

Интерфейс должен быть чётким и включать:

class SkillInterface:
    name: str           # уникальное имя, например "send_report_to_manager"
    description: str    # описание для агента (промпт)
    input_schema: dict  # JSON Schema для входных параметров
    output_schema: dict # JSON Schema для выходных данных
    required_tools: list[str]  # список инструментов, которые skill использует

Пример для skill send_report_to_manager

{
  "name": "send_report_to_manager",
  "description": "Генерирует отчёт по ключевым показателям за указанный период и отправляет его на email менеджеру. Параметры: period (str), manager_email (str).",
  "input_schema": {
    "type": "object",
    "properties": {
      "period": {"type": "string", "enum": ["day", "week", "month"]},
      "manager_email": {"type": "string", "format": "email"}
    },
    "required": ["period", "manager_email"]
  },
  "output_schema": {
    "type": "object",
    "properties": {
      "status": {"type": "string"},
      "email_id": {"type": "string"}
    },
    "required": ["status"]
  },
  "required_tools": ["search_database", "llm_generate", "send_email_api"]
}

Важные принципы:

Fail early: skill должен проверять входные параметры и выдавать понятную ошибку.
Graceful degradation: если один из внутренних инструментов падает, skill может использовать fallback (например, кеш или другой API).
Документация в description должна быть достаточной, чтобы LLM-агент понял, когда его вызывать.

6. Этап 3: Реализация skill'а в коде

from typing import Dict, Any

class SendReportSkill:
    def __init__(self, tools: Dict[str, Any]):
        self.search = tools["search_database"]
        self.llm = tools["llm_generate"]
        self.email = tools["send_email_api"]
    
    async def execute(self, period: str, manager_email: str) -> Dict[str, Any]:
        # 1. Поиск данных
        raw_data = await self.search(query=f"kpi for {period}")
        # 2. Генерация отчёта
        report = await self.llm(prompt=f"Сделай краткий отчёт: {raw_data}")
        # 3. Отправка
        email_id = await self.email(to=manager_email, body=report)
        return {"status": "success", "email_id": email_id}

7. Этап 4: Регистрация skill'а в библиотеке и обучение агента

Пример простого реестра:

from typing import Dict, Type, Any

class SkillRegistry:
    def __init__(self):
        self._skills: Dict[str, Type] = {}
    
    def register(self, skill: Type, interface: dict):
        name = interface["name"]
        self._skills[name] = {"class": skill, "interface": interface}
    
    def get_skill(self, name: str) -> dict:
        return self._skills.get(name)

Обучение агента использовать skill:

Few-shot: добавляем в системный промпт примеры использования skill'ов. Агент понимает, когда вызвать send_report_to_manager, а когда search_billing_info.
Fine-tuning: дообучаем LLM на датасете (запрос → правильный вызов skill). Особенно полезно, если библиотека большая (100+ скиллов).
RL (Reinforcement Learning): агент пробует разные скиллы, получает награду за успешное завершение задачи. Популярные скиллы закрепляются.

8. Примеры конкретных skill'ов

Skill	Композиция	Input	Output
`send_report_to_manager`	search + llm + email	period, email	статус, id письма
`summarize_conversation`	fetch transcript + llm	conversation_id	краткое содержание
`resolve_customer_complaint`	search ticket + llm + update_ticket	ticket_id	разрешённый тикет
`generate_invoice`	search orders + llm + pdf_gen	customer_id, month	PDF + ссылка
`schedule_meeting`	search calendar + llm + send_invite	participants, topic	статус, ссылка

Каждый skill уменьшает когнитивную нагрузку на агента: вместо 5 шагов он делает 1.

9. Метрики эффективности skill библиотеки

Чтобы понять, что skill работает хорошо, используем:

Skill success rate: доля выполнений, завершившихся без ошибки. Цель >95%.
Skill adoption rate: как часто агент выбирает этот skill из библиотеки. Низкий adoption → skill бесполезен или плохо описан.
Average time per task: время выполнения задачи раньше vs с использованием skill.
User satisfaction: через обратную связь (lime/dislike).

Mониторинг:

Логируем каждый вызов skill: вход, трассировка, выход, время.
Alert при падении success rate ниже порога.

10. Жизненный цикл skill'а

Propose (предложение): на основе логов или запроса бизнеса.
Design (дизайн): интерфейс, согласование с командой.
Implement (реализация): код, тесты (unit + integration).
Register (регистрация): добавление в реестр, обновление документации.
Train (обучение агента): few-shot / fine-tune / RL.
Deploy (развёртывание): в staging → тестирование A/B → production.
Monitor (мониторинг): метрики.
Update / Retire (обновление/удаление): если skill перестал быть нужен, его помечают deprecated или удаляют.

11. Инструменты для управления библиотеками

LangChain Hub: можно публиковать и версионировать chain'ы (по сути скиллы) на центральном хабе.
Custom Skill Registry: реализуется на FastAPI + PostgreSQL, с веб-интерфейсом для просмотра и тестирования.
Semantic Kernel (Microsoft): концепция "plugins", аналог skill'ов.
CrewAI / AutoGen: библиотеки для многоагентных систем, где skill — это роль или задача.

12. Связь с Agentic RAG и multi-agent системами

Пет-проект для закрепления

Задача: Создайте простую skill library для агента-помощника, который может:

искать информацию по продукту (search_product),
генерировать краткое описание (generate_description),
отправлять описание по email (send_email).

Объедините их в skill product_brief_to_manager.

Инструменты:

Python (asyncio)
Фейковые API (Mock инструменты: эмулировать поиск, генерацию, email)
Простой LLM для тестирования: OpenAI API (или локальная модель через Ollama)
Реестр словаря

Шаги:

Создайте интерфейсы для трёх инструментов.
Напишите класс ProductBriefSkill, композирующий их.
Реализуйте SkillRegistry и зарегистрируйте skill.
Напишите скрипт, который принимает запрос пользователя и решает, какой skill вызывать (можно через LLM с few-shot промптом).
Вызовите skill для проверки.

Связь с другими вопросами

Вопрос	Тема
571	Что такое AI-агенты и чем они отличаются от обычных LLM?
572	Какие компоненты входят в архитектуру агента?
573	Как агент выбирает, какой инструмент вызвать?
574	Что такое планирование (planning) в агентах и как оно работает?
575	Какие стратегии рефлексии (self-reflection) существуют для агентов?
577	Как вы тестируете и отлаживаете агентов?

Что такое skill libraries для агентов и как их создавать?

Краткий тезис

1. Термин: Skill library (библиотека навыков)

2. Зачем нужны skill libraries?

3. Отличие skill'ов от обычных функций и инструментов

4. Этап 1: Анализ логов агента и выявление частых паттернов

5. Этап 2: Проектирование интерфейса skill'а

6. Этап 3: Реализация skill'а в коде

7. Этап 4: Регистрация skill'а в библиотеке и обучение агента

8. Примеры конкретных skill'ов

9. Метрики эффективности skill библиотеки

10. Жизненный цикл skill'а

11. Инструменты для управления библиотеками

12. Связь с Agentic RAG и multi-agent системами

Пет-проект для закрепления

Связь с другими вопросами

Навигация

Что такое skill libraries для агентов и как их создавать?

Краткий тезис

1. Термин: Skill library (библиотека навыков)

2. Зачем нужны skill libraries?

3. Отличие skill'ов от обычных функций и инструментов

4. Этап 1: Анализ логов агента и выявление частых паттернов

5. Этап 2: Проектирование интерфейса skill'а

6. Этап 3: Реализация skill'а в коде

7. Этап 4: Регистрация skill'а в библиотеке и обучение агента

8. Примеры конкретных skill'ов

9. Метрики эффективности skill библиотеки

10. Жизненный цикл skill'а

11. Инструменты для управления библиотеками

12. Связь с Agentic RAG и multi-agent системами

Пет-проект для закрепления

Связь с другими вопросами

Навигация