Что такое EU AI Act и как оно влияет на деплой LLM в production?

Q: 1. EU AI Act: общее определение и цели

- Обеспечить [[Вики/Safetysecurity\|безопасность]] и соблюдение фундаментальных прав граждан. - Стимулировать инновации за счёт чётких правил. - Создать единый рынок для надёжного ИИ. Закон применяется к любым системам ИИ, которые используются или оказывают влияние на территории ЕС, независимо от места разработки (экстерриториальность). Для [[Вики/LLM\|LLM]] в [[Вики/production\|production]] это означает, что если ваша [[Вики/model\|модель]] обрабатывает [[Вики/Query\|запросы]] пользователей из

Q: 4. Limited risk: compliance check и борьба с галлюцинациями

Limited risk применяется, когда [[Вики/LLM\|LLM]] используется в доменах, где [[Вики/Failure mode\|ошибка]] может нанести вред (финансовые консультации, медицинские рекомендации, юридические советы). Требования включают: - [[Вики/Compliance\|Compliance]] [[Вики/Check\|check]] — регулярное [[Вики/inference\|тестирование]] на [[Вики/галлюцинации\|галлюцинации]], [[Вики/Position bias\|bias]], [[Вики/toxic content\|токсичность]].

Q: 5. High-risk: conformity assessment и human oversight

High-risk — самая строгая категория для [[Вики/LLM\|LLM]]. Сюда попадают системы, которые принимают или существенно влияют на решения в сферах: - Кредитование и страхование. - Трудоустройство и [[Вики/Evaluation\|оценка]] сотрудников. - Доступ к образованию. - Правоохранительная деятельность (кроме запрещённых практик).

Q: 6. Unacceptable risk: запрещённые практики

Категория **unacceptable risk** включает системы ИИ, которые считаются угрозой фундаментальным правам. Для [[Вики/GPT-4o\|LLM]] это: - [[Вики/social scoring\|Social scoring]] — [[Вики/Evaluation\|оценка]] граждан на основе их поведения (например, кредитный [[Вики/Authority score\|рейтинг]], основанный на социальной активности).

Q: 7. Влияние на деплой LLM в production: конкретные шаги

Для ML-инженера [[Вики/EU AI Act\|EU AI Act]] означает необходимость внедрения следующих практик: 1. Классификация use case — на этапе проектирования определить уровень риска. Использовать чеклист из приложения [[Вики/Adaptive computation time\|Act]]. 2. Документирование — вести [[Вики/Model cards\|model card]] и [[Вики/Data card\|data card]] с указанием назначения, ограничений, метрик.

Q: 8. Штрафы и ответственность

| Нарушение | Штраф | |-----------|-------| | Использование запрещённой системы (unacceptable risk) | до 35 млн евро или 7% глобального годового оборота | | Несоблюдение требований для high-risk | до 15 млн евро или 3% оборота | | Непредоставление информации (disclosure) | до 7.5 млн евро или 1.5% оборота |

Краткий тезис

EU AI Act — первый в мире комплексный закон, регулирующий искусственный интеллект на основе уровней риска. Для деплоя LLM в production это означает обязательную классификацию use case, внедрение мер transparency, traceability и human oversight для высокорисковых сценариев, а также потенциальные штрафы до 35 млн евро или 7% глобального оборота за нарушения. Закон вступает в силу поэтапно (2024–2026) и требует от ML-инженеров пересмотреть пайплайны разработки, мониторинга и документирования.

1. EU AI Act: общее определение и цели

EU AI Act (European Union Artificial Intelligence Act) — регламент Европейского союза, принятый в 2024 году, который устанавливает гармонизированные правила для разработки, вывода на рынок и использования систем ИИ. Основные цели:

Обеспечить безопасность и соблюдение фундаментальных прав граждан.
Стимулировать инновации за счёт чётких правил.
Создать единый рынок для надёжного ИИ.

Закон применяется к любым системам ИИ, которые используются или оказывают влияние на территории ЕС, независимо от места разработки (экстерриториальность). Для LLM в production это означает, что если ваша модель обрабатывает запросы пользователей из ЕС, вы обязаны соблюдать Act.

2. Классификация рисков: четыре уровня

Act|EU AI Act делит все системы ИИ на четыре категории риска. Для LLM важно определить, к какому уровню относится конкретный use case.

Уровень риска	Описание	Примеры для LLM	Требования
Minimal risk	Системы без существенного влияния на права и безопасность	Чат-бот для генерации рецептов, переводчик, развлекательный ассистент	Только disclosure (пользователь должен знать, что общается с ИИ)
Limited risk	Системы, которые могут вводить в заблуждение или создавать неудобства	Чат-бот для поддержки клиентов в чувствительных доменах (финансы, здоровье)	Compliance check (проверка на галлюцинации, bias, прозрачность)
High-risk	Системы, влияющие на важные жизненные решения	LLM для кредитного скоринга, отбора резюме, медицинской диагностики	Conformity assessment, traceability, human oversight, technical documentation
Unacceptable risk	Системы, нарушающие фундаментальные права	Social scoring, real-time biometric identification в публичных местах	Запрещены (исключения для правоохранительных органов с судебным разрешением)

Термин Disclosure — обязанность информировать пользователя о том, что он взаимодействует с ИИ (например, пометка «Ответ сгенерирован ИИ»).

Термин Conformity assessment — процедура оценки соответствия системы требованиям Act, включающая внутренний аудит, техническую документацию и, для некоторых случаев, привлечение нотифицированного органа.

3. Minimal risk: только disclosure

Большинство современных LLM-приложений (RAG-системы общего назначения, чат-боты для развлечений) попадают в категорию minimal risk. Основное требование — transparency obligation: пользователь должен быть явно уведомлён, что он общается с ИИ.

Пример реализации

В интерфейсе чата добавить фразу «Ответ подготовлен AI-ассистентом».
В метаданных ответа указать, что он сгенерирован моделью.

Для minimal risk не требуется внешняя сертификация, но рекомендуется вести внутреннюю документацию.

4. Limited risk: compliance check и борьба с галлюцинациями

Limited risk применяется, когда LLM используется в доменах, где ошибка может нанести вред (финансовые консультации, медицинские рекомендации, юридические советы). Требования включают:

Compliance check — регулярное тестирование на галлюцинации, bias, токсичность.
Transparency — указание на ограничения модели (например, «Данный ответ не является профессиональной медицинской консультацией»).
Human-in-the-loop — возможность пользователя обратиться к человеку.

Пример для RAG-системы

Добавить метрику faithfulness (верность фактам) в пайплайн мониторинга.
При обнаружении галлюцинации выше порога — автоматически отправлять ответ на ревью человеку.

5. High-risk: conformity assessment и human oversight

High-risk — самая строгая категория для LLM. Сюда попадают системы, которые принимают или существенно влияют на решения в сферах:

Кредитование и страхование.
Трудоустройство и оценка сотрудников.
Доступ к образованию.
Правоохранительная деятельность (кроме запрещённых практик).

Основные требования

Risk management system — непрерывный процесс идентификации и снижения рисков.
Technical documentation — подробное описание архитектуры, данных, метрик, процедур тестирования.
Record-keeping and logging — автоматическое логирование всех входов/выходов модели, включая timestamp, user ID, контекст.
Transparency and provision of information — объяснение пользователю, как принимается решение (explainability).
Human oversight — возможность человека отменить или пересмотреть решение модели.
Accuracy, robustness, cybersecurity — система должна быть устойчива к атакам и ошибкам.

Пример для LLM в кредитном скоринге:

Модель генерирует объяснение решения (например, «Кредит отклонён из-за высокого соотношения долга к доходу»).
Все запросы и ответы логируются в аудируемом хранилище.
Предусмотрен процесс апелляции для клиента.

6. Unacceptable risk: запрещённые практики

Категория unacceptable risk включает системы ИИ, которые считаются угрозой фундаментальным правам. Для LLM это:

Social scoring — оценка граждан на основе их поведения (например, кредитный рейтинг, основанный на социальной активности).
Real-time biometric identification в публичных местах (кроме случаев с судебным разрешением).
Manipulative AI — системы, которые используют подсознательные техники для искажения поведения (например, LLM, который подталкивает к покупке через скрытые внушения).

Если ваш use case попадает в эту категорию, его нельзя деплоить в ЕС.

7. Влияние на деплой LLM в production: конкретные шаги

Для ML-инженера EU AI Act означает необходимость внедрения следующих практик:

Классификация use case — на этапе проектирования определить уровень риска. Использовать чеклист из приложения Act.
Документирование — вести model card и data card с указанием назначения, ограничений, метрик.
Мониторинг — добавить метрики faithfulness, bias, toxicity в production pipeline.
Логирование — хранить логи запросов и ответов с возможностью аудита (минимум 6 месяцев для high-risk).
Human oversight — для high-risk обеспечить интерфейс для оператора (например, дашборд с предупреждениями).
Explainability — использовать методы интерпретации (LIME, SHAP) или генерировать объяснения на естественном языке.
Security — тестировать на prompt injection, adversarial attacks.

Пример пайплайна для high-risk LLM

# Псевдокод: логирование и human oversight
def process_request(user_input, user_id):
    # 1. Классификация риска (предварительно)
    risk_level = classify_use_case(user_input)
    
    # 2. Генерация ответа
    response = llm.generate(user_input)
    
    # 3. Логирование
    log_entry = {
        "timestamp": datetime.now(),
        "user_id": user_id,
        "input": user_input,
        "output": response,
        "risk_level": risk_level
    }
    audit_log.append(log_entry)
    
    # 4. Проверка на галлюцинации (для limited/high-risk)
    if risk_level in ["limited", "high"]:
        faithfulness_score = compute_faithfulness(response, context)
        if faithfulness_score < 0.7:
            # Отправка на human review
            send_to_human_review(user_input, response)
            return "Ваш запрос передан специалисту."
    
    return response

8. Штрафы и ответственность

EU AI Act предусматривает значительные штрафы за нарушения:

Нарушение	Штраф
Использование запрещённой системы (unacceptable risk)	до 35 млн евро или 7% глобального годового оборота
Несоблюдение требований для high-risk	до 15 млн евро или 3% оборота
Непредоставление информации (disclosure)	до 7.5 млн евро или 1.5% оборота

Для стартапов и малого бизнеса предусмотрены смягчённые санкции, но compliance обязателен.

9. Сравнение с другими регуляциями

Регуляция	Фокус	Влияние на LLM
GDPR	Защита персональных данных	Требует согласия на обработку, права на удаление данных, объяснение решений
EU AI Act	Безопасность и права при использовании ИИ	Классификация рисков, conformity assessment, human oversight
NIST AI RMF (США)	Рекомендательный фреймворк управления рисками	Не обязателен, но может использоваться как дополнение

Для LLM в production необходимо соблюдать оба регламента (GDPR + AI Act), так как они дополняют друг друга.

10. Практические рекомендации для ML-инженера

Начинайте с классификации — используйте официальный чеклист EU AI Act (Annex III) для определения high-risk.
Ведите документацию — model card, data card, risk assessment report.
Автоматизируйте мониторинг — метрики faithfulness, bias, drift.
Обучайте команду — compliance должен быть частью культуры разработки.
Используйте open-source инструменты — например, AI Verify (сингапурский аналог) или IBM AI Fairness 360 для тестирования bias.

Пет-проект для закрепления

Задача Разработать веб-приложение для классификации use case LLM по уровням риска EU AI Act.

Инструменты Python, Streamlit, JSON-правила, библиотека pandas.

Шаги:

Создать JSON-файл с критериями классификации (домен, влияние на права, тип решения).
Написать функцию classify_use_case(domain, decision_type, has_human_oversight).
Реализовать интерфейс на Streamlit: пользователь вводит описание сценария, приложение возвращает уровень риска и список требований.
Добавить примеры: медицинский диагноз (high-risk), чат-бот для рецептов (minimal risk), скоринг кредитов (high-risk).
Вывести таблицу с требованиями для каждого уровня.

Ожидаемый результат Рабочее приложение, которое помогает ML-инженерам быстро оценить, подпадает ли их проект под high-risk, и какие меры нужно внедрить.

Связь с другими вопросами

Вопрос	Тема
731	Что такое AI governance и как его внедрить в ML-команде?
733	Как обеспечить explainability для LLM в production?
734	Как тестировать LLM на bias и дискриминацию?
735	Как организовать логирование и аудит для LLM?
736	Что такое red teaming для LLM и зачем оно нужно?

Краткий тезис

1. EU AI Act: общее определение и цели

Обеспечить безопасность и соблюдение фундаментальных прав граждан.
Стимулировать инновации за счёт чётких правил.
Создать единый рынок для надёжного ИИ.

2. Классификация рисков: четыре уровня

Уровень риска	Описание	Примеры для LLM	Требования
Minimal risk	Системы без существенного влияния на права и безопасность	Чат-бот для генерации рецептов, переводчик, развлекательный ассистент	Только disclosure (пользователь должен знать, что общается с ИИ)
Limited risk	Системы, которые могут вводить в заблуждение или создавать неудобства	Чат-бот для поддержки клиентов в чувствительных доменах (финансы, здоровье)	Compliance check (проверка на галлюцинации, bias, прозрачность)
High-risk	Системы, влияющие на важные жизненные решения	LLM для кредитного скоринга, отбора резюме, медицинской диагностики	Conformity assessment, traceability, human oversight, technical documentation
Unacceptable risk	Системы, нарушающие фундаментальные права	Social scoring, real-time biometric identification в публичных местах	Запрещены (исключения для правоохранительных органов с судебным разрешением)

3. Minimal risk: только disclosure

Пример реализации

В интерфейсе чата добавить фразу «Ответ подготовлен AI-ассистентом».
В метаданных ответа указать, что он сгенерирован моделью.

Для minimal risk не требуется внешняя сертификация, но рекомендуется вести внутреннюю документацию.

4. Limited risk: compliance check и борьба с галлюцинациями

Compliance check — регулярное тестирование на галлюцинации, bias, токсичность.
Transparency — указание на ограничения модели (например, «Данный ответ не является профессиональной медицинской консультацией»).
Human-in-the-loop — возможность пользователя обратиться к человеку.

Пример для RAG-системы

Добавить метрику faithfulness (верность фактам) в пайплайн мониторинга.
При обнаружении галлюцинации выше порога — автоматически отправлять ответ на ревью человеку.

5. High-risk: conformity assessment и human oversight

Кредитование и страхование.
Трудоустройство и оценка сотрудников.
Доступ к образованию.
Правоохранительная деятельность (кроме запрещённых практик).

Основные требования

Risk management system — непрерывный процесс идентификации и снижения рисков.
Technical documentation — подробное описание архитектуры, данных, метрик, процедур тестирования.
Record-keeping and logging — автоматическое логирование всех входов/выходов модели, включая timestamp, user ID, контекст.
Transparency and provision of information — объяснение пользователю, как принимается решение (explainability).
Human oversight — возможность человека отменить или пересмотреть решение модели.
Accuracy, robustness, cybersecurity — система должна быть устойчива к атакам и ошибкам.

Пример для LLM в кредитном скоринге:

Модель генерирует объяснение решения (например, «Кредит отклонён из-за высокого соотношения долга к доходу»).
Все запросы и ответы логируются в аудируемом хранилище.
Предусмотрен процесс апелляции для клиента.

6. Unacceptable risk: запрещённые практики

Категория unacceptable risk включает системы ИИ, которые считаются угрозой фундаментальным правам. Для LLM это:

Social scoring — оценка граждан на основе их поведения (например, кредитный рейтинг, основанный на социальной активности).
Real-time biometric identification в публичных местах (кроме случаев с судебным разрешением).
Manipulative AI — системы, которые используют подсознательные техники для искажения поведения (например, LLM, который подталкивает к покупке через скрытые внушения).

Если ваш use case попадает в эту категорию, его нельзя деплоить в ЕС.

7. Влияние на деплой LLM в production: конкретные шаги

Для ML-инженера EU AI Act означает необходимость внедрения следующих практик:

Классификация use case — на этапе проектирования определить уровень риска. Использовать чеклист из приложения Act.
Документирование — вести model card и data card с указанием назначения, ограничений, метрик.
Мониторинг — добавить метрики faithfulness, bias, toxicity в production pipeline.
Логирование — хранить логи запросов и ответов с возможностью аудита (минимум 6 месяцев для high-risk).
Human oversight — для high-risk обеспечить интерфейс для оператора (например, дашборд с предупреждениями).
Explainability — использовать методы интерпретации (LIME, SHAP) или генерировать объяснения на естественном языке.
Security — тестировать на prompt injection, adversarial attacks.

Пример пайплайна для high-risk LLM

# Псевдокод: логирование и human oversight
def process_request(user_input, user_id):
    # 1. Классификация риска (предварительно)
    risk_level = classify_use_case(user_input)
    
    # 2. Генерация ответа
    response = llm.generate(user_input)
    
    # 3. Логирование
    log_entry = {
        "timestamp": datetime.now(),
        "user_id": user_id,
        "input": user_input,
        "output": response,
        "risk_level": risk_level
    }
    audit_log.append(log_entry)
    
    # 4. Проверка на галлюцинации (для limited/high-risk)
    if risk_level in ["limited", "high"]:
        faithfulness_score = compute_faithfulness(response, context)
        if faithfulness_score < 0.7:
            # Отправка на human review
            send_to_human_review(user_input, response)
            return "Ваш запрос передан специалисту."
    
    return response

8. Штрафы и ответственность

EU AI Act предусматривает значительные штрафы за нарушения:

Нарушение	Штраф
Использование запрещённой системы (unacceptable risk)	до 35 млн евро или 7% глобального годового оборота
Несоблюдение требований для high-risk	до 15 млн евро или 3% оборота
Непредоставление информации (disclosure)	до 7.5 млн евро или 1.5% оборота

Для стартапов и малого бизнеса предусмотрены смягчённые санкции, но compliance обязателен.

9. Сравнение с другими регуляциями

Регуляция	Фокус	Влияние на LLM
GDPR	Защита персональных данных	Требует согласия на обработку, права на удаление данных, объяснение решений
EU AI Act	Безопасность и права при использовании ИИ	Классификация рисков, conformity assessment, human oversight
NIST AI RMF (США)	Рекомендательный фреймворк управления рисками	Не обязателен, но может использоваться как дополнение

Для LLM в production необходимо соблюдать оба регламента (GDPR + AI Act), так как они дополняют друг друга.

10. Практические рекомендации для ML-инженера

Начинайте с классификации — используйте официальный чеклист EU AI Act (Annex III) для определения high-risk.
Ведите документацию — model card, data card, risk assessment report.
Автоматизируйте мониторинг — метрики faithfulness, bias, drift.
Обучайте команду — compliance должен быть частью культуры разработки.
Используйте open-source инструменты — например, AI Verify (сингапурский аналог) или IBM AI Fairness 360 для тестирования bias.

Пет-проект для закрепления

Задача Разработать веб-приложение для классификации use case LLM по уровням риска EU AI Act.

Инструменты Python, Streamlit, JSON-правила, библиотека pandas.

Шаги:

Создать JSON-файл с критериями классификации (домен, влияние на права, тип решения).
Написать функцию classify_use_case(domain, decision_type, has_human_oversight).
Реализовать интерфейс на Streamlit: пользователь вводит описание сценария, приложение возвращает уровень риска и список требований.
Добавить примеры: медицинский диагноз (high-risk), чат-бот для рецептов (minimal risk), скоринг кредитов (high-risk).
Вывести таблицу с требованиями для каждого уровня.

Связь с другими вопросами

Вопрос	Тема
731	Что такое AI governance и как его внедрить в ML-команде?
733	Как обеспечить explainability для LLM в production?
734	Как тестировать LLM на bias и дискриминацию?
735	Как организовать логирование и аудит для LLM?
736	Что такое red teaming для LLM и зачем оно нужно?

Что такое EU AI Act и как оно влияет на деплой LLM в production?

Краткий тезис

1. EU AI Act: общее определение и цели

2. Классификация рисков: четыре уровня

3. Minimal risk: только disclosure

4. Limited risk: compliance check и борьба с галлюцинациями

5. High-risk: conformity assessment и human oversight

6. Unacceptable risk: запрещённые практики

7. Влияние на деплой LLM в production: конкретные шаги

8. Штрафы и ответственность

9. Сравнение с другими регуляциями

10. Практические рекомендации для ML-инженера

Пет-проект для закрепления

Связь с другими вопросами

Навигация

Что такое EU AI Act и как оно влияет на деплой LLM в production?

Краткий тезис

1. EU AI Act: общее определение и цели

2. Классификация рисков: четыре уровня

3. Minimal risk: только disclosure

4. Limited risk: compliance check и борьба с галлюцинациями

5. High-risk: conformity assessment и human oversight

6. Unacceptable risk: запрещённые практики

7. Влияние на деплой LLM в production: конкретные шаги

8. Штрафы и ответственность

9. Сравнение с другими регуляциями

10. Практические рекомендации для ML-инженера

Пет-проект для закрепления

Связь с другими вопросами

Навигация