Поиск

  • wikiSimulation testing

    # Simulation testing ## Определение Метод тестирования AI-агентов в контролируемой симулированной среде с подменой внешних взаимодействий. ## Где встречается - [[788. Что такое…

  • wikiStateful testing

    # Stateful testing ## Определение Техника property-based testing для агентов с внутренним состоянием, использующая автоматные модели для проверки корректности переходов. ## Где…

  • wikiContract testing

    # Contract testing ## Определение Метод тестирования, при котором потребитель описывает ожидаемый контракт данных (например, JSON-схему), а поставщик должен ему соответствовать…

  • wikimetrics-driven testing

    # metrics-driven testing ## Определение Подход к тестированию, основанный на проверке значений счётчиков метрик для оценки корректности поведения системы. ## Где встречается…

  • wikifault injection

    …Реализовать simulation testing|148. Реализовать simulation testing]] - [[153. Настроить chaos testing|153. Настроить chaos testing]] - [[183. Реализовать circuit breaker на…

  • wikiPrompt Regression Testing

    # Prompt Regression Testing ## Определение Метод проверки, что изменение промпта не ухудшает качество ответов на ранее протестированные сценарии. ## Где встречается - [[797…

  • wikiproperty-based testing

    # property-based testing ## Определение Метод тестирования, проверяющий инвариантные свойства системы вместо конкретных ответов, часто используется для агентов и генерации случайных…

  • wikiautomated testing

    # automated testing ## Определение Автоматические тесты для проверки качества агентов или моделей, включая property-based testing. ## Где встречается - [[Практика|Практика]] ## Навигация…

  • wikitool testing

    # tool testing ## Определение Изолированное тестирование каждого инструмента агента для проверки корректности его работы без влияния других компонентов. ## Где встречается - [[Практика…

  • wikiChaos Toolkit

    …Реализовать simulation testing|148. Реализовать simulation testing]] - [[153. Настроить chaos testing|153. Настроить chaos testing]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiUsability testing

    # Usability testing ## Определение Метод оценки пользовательского интерфейса, при котором реальные пользователи выполняют сценарии, чтобы выявить проблемы восприятия и понять, правильно…

  • wikiPenetration Testing

    # Penetration Testing ## Определение Метод оценки безопасности, при котором имитируются атаки для выявления уязвимостей, включая тестирование изоляции между клиентами в multi…

  • wikiMultiple Testing

    # Multiple Testing ## Определение Проверка нескольких статистических гипотез одновременно, что увеличивает риск ложноположительных результатов. ## Где встречается - [[342. Что такое statistical power…

  • wikiWireMock

    …Что такое «simulation testing» (тестирование в симулированной среде)|788. Что такое «simulation testing» (тестирование в симулированной среде)]] - [[799. Как интегрировать…

  • wikiMock API

    …Что такое «simulation testing» (тестирование в симулированной среде)|788. Что такое «simulation testing» (тестирование в симулированной среде)]] - [[Практика|Практика]] - [[800…

  • wikiLoad testing

    # Load testing ## Определение Нагрузочное тестирование LLM endpoint для оценки производительности, латентности и стабильности под реальной нагрузкой. Часто выполняется с помощью…

  • wikiDeterministic testing

    # Deterministic testing ## Определение Метод тестирования, при котором проверки дают однозначный результат, используются для unit-тестов агентов. ## Где встречается - [[800+ вопросов…

  • wikisequential testing

    # sequential testing ## Определение Метод A/B-тестирования, позволяющий останавливать эксперимент при достижении статистической значимости без увеличения ошибки I рода. Исключает…

  • wikiFlakiness

    # Flakiness ## Определение Проблема невоспроизводимых ошибок в property-based testing, решаемая фиксацией seed. ## Где встречается - [[787. Как делать property-based testing

  • wikiresponses

    …Что такое «simulation testing» (тестирование в симулированной среде)|788. Что такое «simulation testing» (тестирование в симулированной среде)]] - [[799. Как интегрировать…

  • wikiEnd-to-end testing

    # End-to-end testing ## Определение Процесс запуска E2E тестов для проверки полного цикла; учитывает стохастичность (многократный запуск). ## Где встречается - [[800…

  • wikicoverage-guided testing

    # coverage-guided testing ## Определение Метод тестирования, генерирующий запросы для покрытия редких путей выполнения программы, что помогает выявлять скрытые ошибки. ## Где…

  • wikiInvariant

    # Invariant ## Определение Условие, которое должно выполняться для всех входных данных при property-based testing агентов. ## Где встречается - [[787. Как делать…

  • wikiPrompt testing strategies

    # Prompt testing strategies ## Определение Подходы к тестированию корректности и устойчивости промптов, включая регрессионное и A/B-тестирование. ## Где встречается - [[167…

  • wikiRefusal testing

    # Refusal testing ## Определение Тесты, проверяющие, что модель корректно отклоняет запросы, выходящие за рамки дозволенного, и не галлюцинирует. ## Где встречается - [[798…

  • wikiBehavioral testing

    # Behavioral testing ## Определение Подход к тестированию VLM с использованием минимальных пар (изображение, подпись) для выявления систематических ошибок и пропущенных деталей…

  • wikibinomial testing

    # binomial testing ## Определение Статистический тест для проверки гипотезы о доле успехов. В контексте оценки качества модели используется для определения, в…

  • wikiMultiple Testing Correction

    # Multiple Testing Correction ## Определение Корректировка уровня значимости (α) при множественном тестировании для контроля вероятности ложных открытий. ## Где встречается - [[491. Что…

  • wikipytest-cov

    # pytest-cov ## Определение Плагин pytest для измерения покрытия кода тестами, применяемый в property-based testing и оценке полноты тестирования. ## Где…

  • wikiShadow testing

    # Shadow testing ## Определение Техника MLOps, при которой новый промпт применяется ко всем запросам, но пользователю возвращается ответ от старой версии…

  • wikistructlog

    …Реализовать simulation testing|148. Реализовать simulation testing]] - [[153. Настроить chaos testing|153. Настроить chaos testing]] - [[163. Реализовать AB тестирование промптов…

  • wikiMonotonicity

    …Как делать property-based testing для агентов|787. Как делать property-based testing для агентов]] - [[800+ вопросов|800+ вопросов]] ## Навигация…

  • wikihttpx

    …Реализовать chaos testing для агента|98. Реализовать chaos testing для агента]] - [[124. Настроить SLA между агентами|124. Настроить SLA между…

  • wikiIntegration testing

    # Integration testing ## Определение Метод проверки совместной работы компонентов системы (агентов, инструментов) с использованием моков или реальных вызовов для выявления ошибок…

  • wikismoke tests

    …Что такое «regression testing» для агентов (старый кейс сломался)|792. Что такое «regression testing» для агентов (старый кейс сломался)]] - [[Практика…

  • wikiaioresponses

    …Реализовать simulation testing|148. Реализовать simulation testing]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]

  • wikipytest-httpx

    …Реализовать simulation testing|148. Реализовать simulation testing]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]

  • wikiChaosProxy

    …Настроить chaos testing|153. Настроить chaos testing]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]

  • wikiin-process mock

    …Реализовать simulation testing|148. Реализовать simulation testing]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]

  • wikirespx

    …Реализовать simulation testing|148. Реализовать simulation testing]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов]] - [[Оглавление|Оглавление]]

  • wikiPhantom

    …Как делать property-based testing для агентов|787. Как делать property-based testing для агентов]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikideterminism rate

    …Что такое «simulation testing» (тестирование в симулированной среде)|788. Что такое «simulation testing» (тестирование в симулированной среде)]] ## Навигация - [[00. Индекс…

  • wikiSageMaker

    …Что такое «canary testing» для агентов (10% трафика на новую версию)|790. Что такое «canary testing» для агентов (10% трафика…

  • wikiMoto

    …Что такое «simulation testing» (тестирование в симулированной среде)|788. Что такое «simulation testing» (тестирование в симулированной среде)]] ## Навигация - [[00. Индекс…

  • wikiSplit

    …Что такое «canary testing» для агентов (10% трафика на новую версию)|790. Что такое «canary testing» для агентов (10% трафика…

  • wikiVCR.py

    …Что такое «simulation testing» (тестирование в симулированной среде)|788. Что такое «simulation testing» (тестирование в симулированной среде)]] ## Навигация - [[00. Индекс…

  • answerЧто такое «simulation testing» (тестирование в симулированной среде)?

    …Что такое «simulation testing» (тестирование в симулированной среде)? ## Краткий тезис [[Вики/Simulation testing\|Simulation testing]] — это метод тестирования AI-агентов…

  • wikipytest-timeout

    …Реализовать simulation testing|148. Реализовать simulation testing]] - [[152. Реализовать test generation для агента|152. Реализовать test generation для агента]] ## Навигация…

  • wikipytest

    …Что такое «regression testing» для агентов (старый кейс сломался)|792. Что такое «regression testing» для агентов (старый кейс сломался)]] - [[797…

  • wikistub database

    …Что такое «simulation testing» (тестирование в симулированной среде)|788. Что такое «simulation testing» (тестирование в симулированной среде)]] ## Навигация - [[00. Индекс…