Как управлять версиями промптов в production (best practices)?

Q: 2. Git как единственный источник истины (source of truth)

Все [[Вики/промпты\|промпты]] должны храниться в Git-репозитории в читаемой текстовой форме (например, [[Вики/XML\|YAML]], [[Вики/XML\|JSON]] или Jinja2-шаблоны). Это даёт: - Полную историю изменений с авторами и датами - Возможность [[Вики/SQL\|code]] [[Вики/Review\|review]] перед деплоем

Q: 3. Семантическое версионирование (SemVer)

Применяем **[[Вики/Semantic Versioning\|SemVer]]** к промптам: `[[Вики/Semantic Versioning\|MAJOR.MINOR.PATCH]]`. | Компонент | Пример изменения | Когда применять | |-----------|------------------|----------------| | **MAJOR** | Полностью переработан формат вывода, нарушена обратная совместимость с downstream-агентами | Изменение требует обновления логики других компонентов |

Q: 4. Неизменяемые версии (immutable versions)

Каждая опубликованная [[Вики/промпт агента\|версия промпта]] **не может быть изменена**. Если найден баг — создаётся [[Вики/candidate\|новая версия]] (например, `v1.0.1`), а старая остаётся доступной только для чтения. Почему это важно: - [[Вики/consistency\|Воспроизводимость]]: можно точно сказать, какой [[Вики/prompt\|промпт]] сработал в инциденте

Q: 5. Тегирование: latest, stable, canary

Кроме семантических версий, используются **потоковые теги ([[Вики/canary deployment\|flow tags]])**, указывающие на конкретную семантическую версию: | Тег | Назначение | |-----|------------| | `latest` | Текущая версия, развёрнутая на production (может быть нестабильной) | | `stable` | Версия, подтверждённая регрессионными тестами и A/B экспериментами |

Q: 6. Rollback (откат)

- [[Вики/git revert\|Git revert]] — создание нового коммита, отменяющего изменения, и [[Вики/canary deployment\|развёртывание]] этого коммита - [[Вики/fallback model\|Переключение]] тега — например, `[[Вики/canary deployment\|latest]]` снова указывает на `v1.0.0` вместо `v1.1.0` - Мгновенный [[Вики/fallback model\|откат]] через [[Вики/Feature flag\|feature flag]]: хранить обе версии в системе и переключать их по флагу без редеплоя

Краткий тезис

Управление версиями промптов — это критически важная практика для production-систем, особенно в архитектуре Agentic RAG, где десятки промптов взаимодействуют друг с другом. Основные best practices: хранение промптов в Git как единственном источнике истины (source of truth), использование семантического версионирования (SemVer), создание неизменяемых версий, тегирование (latest, stable, canary), автоматическое тестирование|регрессионное тестирование при каждом изменении и полноценная документация. Такой подход позволяет безопасно экспериментировать, быстро откатываться и поддерживать прозрачность изменений.

1. Термин: Prompt versioning (управление версиями промптов)

Prompt versioning — это процесс отслеживания, документирования и контроля изменений текстов промптов (инструкций, шаблонов, few-shot примеров) на протяжении жизненного цикла системы. В RAG|agentic RAG промпты используются не только для генерации финального ответа, но и для:

Формирования поискового запроса (rewriting)
Ранжирования кандидатов (reranking)
Выбора действий агента (planning)
Формирования ответа с ссылками (grounding)

Ошибка в одном промпте может привести к каскадному сбою всей цепочки агентов. Поэтому версионирование — не опция, а обязательное условие надёжности.

2. Git как единственный источник истины (source of truth)

Все промпты должны храниться в Git-репозитории в читаемой текстовой форме (например, YAML, JSON или Jinja2-шаблоны). Это даёт:

Полную историю изменений с авторами и датами
Возможность code review перед деплоем
Воспроизводимость: по тегу коммита можно точно восстановить, какие промпты были активны

Пример структуры репозитория:

prompts/
├── v1.0.0/
│   ├── system_agent.yaml
│   ├── search_rewriter.yaml
│   ├── answer_generator.yaml
│   └── router_agent.yaml
├── v1.1.0/
│   ├── system_agent.yaml
│   └── ...
├── latest/        # символическая ссылка на текущую production-директорию
└── stable/        # символическая ссылка на стабильную версию

Каждый промпт — это файл с метаданными (описание, ожидаемый формат вывода, версия, автор).

3. Семантическое версионирование (SemVer)

Применяем SemVer к промптам: MAJOR.MINOR.PATCH.

Компонент	Пример изменения	Когда применять
MAJOR	Полностью переработан формат вывода, нарушена обратная совместимость с downstream-агентами	Изменение требует обновления логики других компонентов
MINOR	Добавлен новый few-shot пример, расширена инструкция без нарушения совместимости	Новые возможности, улучшение качества
PATCH	Исправлена опечатка, уточнён пример	Баги, опечатки, незначительные правки

Пример: v2.1.0 — второе поколение промпта с новыми примерами.

Хорошей практикой является отдельный CHANGELOG.md для каждого промпта или общий changelog в репозитории.

4. Неизменяемые версии (immutable versions)

Каждая опубликованная версия промпта не может быть изменена. Если найден баг — создаётся новая версия (например, v1.0.1), а старая остаётся доступной только для чтения.

Почему это важно:

Воспроизводимость: можно точно сказать, какой промпт сработал в инциденте
Откат: всегда есть предыдущая рабочая версия
Аудит: compliance и безопасность требуют неизменяемых записей

Технически, в Git это реализуется через тэги (git tag v1.0.0) и запрет на push с перезаписью тэгов.

5. Тегирование: latest, stable, canary

Кроме семантических версий, используются потоковые теги (flow tags), указывающие на конкретную семантическую версию:

Тег	Назначение
`latest`	Текущая версия, развёрнутая на production (может быть нестабильной)
`stable`	Версия, подтверждённая регрессионными тестами и A/B экспериментами
`canary`	Кандидат на релиз, развёртывается на 5-10% трафика для проверки

Процесс продвижения: canary → после прогона тестов → stable → после подтверждения метрик → latest.

Пример автоматизации — CI/CD пайплайн обновляет файлы-симлинки в репозитории или записывает конфигурацию в конфигурационный сервис (Consul, Kubernetes ConfigMap).

6. Rollback (откат)

Откат — это возврат к предыдущей стабильной версии промпта. Механизмы:

Git revert — создание нового коммита, отменяющего изменения, и развёртывание этого коммита
Переключение тега — например, latest снова указывает на v1.0.0 вместо v1.1.0
Мгновенный откат через feature flag: хранить обе версии в системе и переключать их по флагу без редеплоя

Рекомендуется хранить минимум 3 последние версии каждого промпта и автоматически очищать очень старые (архивировать).

7. Тестирование при каждом изменении

Каждое изменение промпта должно проходить регрессионный тест-сьют, включающий:

Синтаксическая валидация: корректность YAML/JSON, отсутствие непарных фигурных скобок
Семантическая проверка: промпт генерирует ожидаемый формат вывода (parseability)
Функциональные тесты: запуск на золотых запросах, сравнение с эталонными ответами (например, с помощью LLM-as-a-judge)
A/B эксперимент в production: сравнение метрик (faithfulness, answer relevance, latency) между старой и новой версией

Пример автоматического теста на Python:

import yaml
from prompt_tester import run_scenario

def test_prompt_format():
    with open("prompts/v1.1.0/answer_generator.yaml") as f:
        prompt = yaml.safe_load(f)
    result = run_scenario(
        prompt=prompt,
        test_input={"query": "Что такое LLM?", "context": ["LLM — это ..."]}
    )
    assert "answer" in result, "Промпт не вернул поле answer"

8. Документация каждого промпта

Каждый промпт должен сопровождаться документацией, встроенной в файл (в виде комментариев или метаданных YAML):

# answer_generator.yaml
version: 1.1.0
author: "ivan.ivanov"
description: "Генерирует ответ пользователю на основе контекста и запроса. Используется в финальном шаге RAG."
input_schema:
  query: str
  context: list[str]
output_schema:
  answer: str
  citations: list[int]
examples:
  - input: {query: "Как работает RAG?", context: [...]}
    output: {answer: "RAG — это ...", citations: [1,2]}
changelog:
  - version: 1.1.0
    date: 2025-03-20
    changes: "Добавлен few-shot пример с цитированием"

Такая документация позволяет новым членам команды быстро разобраться, а также автоматически генерировать каталог промптов.

9. Интеграция с LLMOps-инструментами

Для продакшн-систем используют платформы трекинга экспериментов:

LangSmith — версионирование промптов, трейсинг вызовов LLM, сравнение версий
Weights & Biases (W&B) Prompts — логирование версий и метрик
MLflow — registry для промптов как моделей

Эти инструменты позволяют хранить не только текст промпта, но и гиперпараметры (temperature), top_p), привязанные к версии.

10. Сводка best practices

Практика	Описание	Инструменты
Git-репозиторий	Единственный источник истины для промптов	GitHub, GitLab
SemVer	MAJOR.MINOR.PATCH	Git tags
Неизменяемость	Запрет на модификацию опубликованных версий	Protected tags, CI
Теги	latest, stable, canary	Файлы-симлинки, K8s ConfigMap
Тестирование	Regression suite при каждом PR	Pytest, LLM-as-a-judge
Документация	YAML-метаданные в файле промпта	Inline docs, auto-generators
Интеграция	Трекинг версий и метрик	LangSmith, W&B, MLflow
Rollback	Возврат к предыдущей версии через Git или feature flag	Git revert, LaunchDarkly

Пет-проект для закрепления

Задача: Реализовать систему управления версиями промптов для чат-бота, который отвечает на вопросы по документации продукта.

Инструменты: Python, Git (локальный), YAML, pytest, LangSmith (free tier), небольшая FastAPI-обёртка.

Шаги:

Создать репозиторий с папкой prompts/ и тремя файлами-промптами в версии v0.1.0.
Добавить CI-скрипт на Python, который валидирует структуру YAML и запускает тесты (проверка вывода).
Применить SemVer: проапгрейдить один из промптов с minor-изменением (добавить пример), создать тэг v0.2.0.
Настроить теги latest (v0.2.0) и stable (v0.1.0) как символические ссылки.
Написать скрипт rollback.py, который переключает latest на stable.
Интегрировать LangSmith: при каждом запуске логировать версию промпта и метрики faithfulness.
Добавить документацию в формате YAML-метаданных.

Ожидаемый результат: Рабочая система, где можно посмотреть историю изменений, откатиться на стабильную версию, и все промпты покрыты тестами.

Связь с другими вопросами

Вопрос	Тема
804	Как проектировать промпты для агентов?
808	Как тестировать агентов в production?
810	Как мониторить и логировать работу агентов?
801	Что такое Agentic RAG и его архитектура?
806	Как обеспечить безопасность в system prompt?

Краткий тезис

1. Термин: Prompt versioning (управление версиями промптов)

Формирования поискового запроса (rewriting)
Ранжирования кандидатов (reranking)
Выбора действий агента (planning)
Формирования ответа с ссылками (grounding)

2. Git как единственный источник истины (source of truth)

Полную историю изменений с авторами и датами
Возможность code review перед деплоем
Воспроизводимость: по тегу коммита можно точно восстановить, какие промпты были активны

Пример структуры репозитория:

prompts/
├── v1.0.0/
│   ├── system_agent.yaml
│   ├── search_rewriter.yaml
│   ├── answer_generator.yaml
│   └── router_agent.yaml
├── v1.1.0/
│   ├── system_agent.yaml
│   └── ...
├── latest/        # символическая ссылка на текущую production-директорию
└── stable/        # символическая ссылка на стабильную версию

Каждый промпт — это файл с метаданными (описание, ожидаемый формат вывода, версия, автор).

3. Семантическое версионирование (SemVer)

Применяем SemVer к промптам: MAJOR.MINOR.PATCH.

Компонент	Пример изменения	Когда применять
MAJOR	Полностью переработан формат вывода, нарушена обратная совместимость с downstream-агентами	Изменение требует обновления логики других компонентов
MINOR	Добавлен новый few-shot пример, расширена инструкция без нарушения совместимости	Новые возможности, улучшение качества
PATCH	Исправлена опечатка, уточнён пример	Баги, опечатки, незначительные правки

Пример: v2.1.0 — второе поколение промпта с новыми примерами.

Хорошей практикой является отдельный CHANGELOG.md для каждого промпта или общий changelog в репозитории.

4. Неизменяемые версии (immutable versions)

Почему это важно:

Воспроизводимость: можно точно сказать, какой промпт сработал в инциденте
Откат: всегда есть предыдущая рабочая версия
Аудит: compliance и безопасность требуют неизменяемых записей

Технически, в Git это реализуется через тэги (git tag v1.0.0) и запрет на push с перезаписью тэгов.

5. Тегирование: latest, stable, canary

Тег	Назначение
`latest`	Текущая версия, развёрнутая на production (может быть нестабильной)
`stable`	Версия, подтверждённая регрессионными тестами и A/B экспериментами
`canary`	Кандидат на релиз, развёртывается на 5-10% трафика для проверки

Процесс продвижения: canary → после прогона тестов → stable → после подтверждения метрик → latest.

6. Rollback (откат)

Откат — это возврат к предыдущей стабильной версии промпта. Механизмы:

Git revert — создание нового коммита, отменяющего изменения, и развёртывание этого коммита
Переключение тега — например, latest снова указывает на v1.0.0 вместо v1.1.0
Мгновенный откат через feature flag: хранить обе версии в системе и переключать их по флагу без редеплоя

7. Тестирование при каждом изменении

Каждое изменение промпта должно проходить регрессионный тест-сьют, включающий:

Синтаксическая валидация: корректность YAML/JSON, отсутствие непарных фигурных скобок
Семантическая проверка: промпт генерирует ожидаемый формат вывода (parseability)
Функциональные тесты: запуск на золотых запросах, сравнение с эталонными ответами (например, с помощью LLM-as-a-judge)
A/B эксперимент в production: сравнение метрик (faithfulness, answer relevance, latency) между старой и новой версией

Пример автоматического теста на Python:

import yaml
from prompt_tester import run_scenario

def test_prompt_format():
    with open("prompts/v1.1.0/answer_generator.yaml") as f:
        prompt = yaml.safe_load(f)
    result = run_scenario(
        prompt=prompt,
        test_input={"query": "Что такое LLM?", "context": ["LLM — это ..."]}
    )
    assert "answer" in result, "Промпт не вернул поле answer"

8. Документация каждого промпта

# answer_generator.yaml
version: 1.1.0
author: "ivan.ivanov"
description: "Генерирует ответ пользователю на основе контекста и запроса. Используется в финальном шаге RAG."
input_schema:
  query: str
  context: list[str]
output_schema:
  answer: str
  citations: list[int]
examples:
  - input: {query: "Как работает RAG?", context: [...]}
    output: {answer: "RAG — это ...", citations: [1,2]}
changelog:
  - version: 1.1.0
    date: 2025-03-20
    changes: "Добавлен few-shot пример с цитированием"

9. Интеграция с LLMOps-инструментами

Для продакшн-систем используют платформы трекинга экспериментов:

LangSmith — версионирование промптов, трейсинг вызовов LLM, сравнение версий
Weights & Biases (W&B) Prompts — логирование версий и метрик
MLflow — registry для промптов как моделей

10. Сводка best practices

Практика	Описание	Инструменты
Git-репозиторий	Единственный источник истины для промптов	GitHub, GitLab
SemVer	MAJOR.MINOR.PATCH	Git tags
Неизменяемость	Запрет на модификацию опубликованных версий	Protected tags, CI
Теги	latest, stable, canary	Файлы-симлинки, K8s ConfigMap
Тестирование	Regression suite при каждом PR	Pytest, LLM-as-a-judge
Документация	YAML-метаданные в файле промпта	Inline docs, auto-generators
Интеграция	Трекинг версий и метрик	LangSmith, W&B, MLflow
Rollback	Возврат к предыдущей версии через Git или feature flag	Git revert, LaunchDarkly

Пет-проект для закрепления

Инструменты: Python, Git (локальный), YAML, pytest, LangSmith (free tier), небольшая FastAPI-обёртка.

Шаги:

Создать репозиторий с папкой prompts/ и тремя файлами-промптами в версии v0.1.0.
Добавить CI-скрипт на Python, который валидирует структуру YAML и запускает тесты (проверка вывода).
Применить SemVer: проапгрейдить один из промптов с minor-изменением (добавить пример), создать тэг v0.2.0.
Настроить теги latest (v0.2.0) и stable (v0.1.0) как символические ссылки.
Написать скрипт rollback.py, который переключает latest на stable.
Интегрировать LangSmith: при каждом запуске логировать версию промпта и метрики faithfulness.
Добавить документацию в формате YAML-метаданных.

Связь с другими вопросами

Вопрос	Тема
804	Как проектировать промпты для агентов?
808	Как тестировать агентов в production?
810	Как мониторить и логировать работу агентов?
801	Что такое Agentic RAG и его архитектура?
806	Как обеспечить безопасность в system prompt?

Как управлять версиями промптов в production (best practices)?

Краткий тезис

1. Термин: Prompt versioning (управление версиями промптов)

2. Git как единственный источник истины (source of truth)

3. Семантическое версионирование (SemVer)

4. Неизменяемые версии (immutable versions)

5. Тегирование: latest, stable, canary

6. Rollback (откат)

7. Тестирование при каждом изменении

8. Документация каждого промпта

9. Интеграция с LLMOps-инструментами

10. Сводка best practices

Пет-проект для закрепления

Связь с другими вопросами

Навигация

Как управлять версиями промптов в production (best practices)?

Краткий тезис

1. Термин: Prompt versioning (управление версиями промптов)

2. Git как единственный источник истины (source of truth)

3. Семантическое версионирование (SemVer)

4. Неизменяемые версии (immutable versions)

5. Тегирование: latest, stable, canary

6. Rollback (откат)

7. Тестирование при каждом изменении

8. Документация каждого промпта

9. Интеграция с LLMOps-инструментами

10. Сводка best practices

Пет-проект для закрепления

Связь с другими вопросами

Навигация