Knowledge Portal

aivaro.ru

  • Оглавление
  • Вопросы
  • Практика
  • Вики
  • Тесты
  • Поиск
✈Telegram @AetSeidhe
RUEN中文
…
Оглавление/Вики/Scenario

Scenario

Scenario

Определение

Высокоуровневое описание задачи пользователя и ожидаемого поведения агента; задаёт структуру диалога.

Где встречается

  • 695. Как вы делаете synthetic data для multi-turn диалогов (агентов)

Навигация

  • Индекс терминов
  • Индекс разборов
  • Оглавление

Теги

wikiтерминagentsdata

Ссылки

  • Как вы делаете synthetic data для multi-turn диалогов (агентов)?

Обратные ссылки (61)

  • OpenAI vs Anthropic vs Groq vs Self-hosted — что выбираете?
  • Индекс терминов
  • Как в Harness Engineering реализована эвалюация и дрейф (evaluation & drift)?
  • Как вы боретесь с «бесконечным циклом» агента в Agentic RAG?
  • Как вы делаете synthetic data для multi-turn диалогов (агентов)?
  • Как вы деплоите LLM на spot instances в облаке?
  • Как вы деплоите LLM с requirement <100ms latency при throughput 1000 req/s? Архитектура.
  • Как вы защищаете RAG от data poisoning через неявные инструкции (subtle injections)?
  • Как вы комбинируете реальные и синтетические данные для максимального качества?
  • Как вы оцениваете cost-effectiveness LLM-пайплайна?
  • Как вы оцениваете мультимодальную модель на галлюцинации (POPE, MMHal-Bench)?
  • Как вы проектируете canary deployment для LLM модели?
  • Как вы проектируете red teaming evaluation для jailbreak устойчивости?
  • Как вы профилируете GPU utilization для LLM serving (nsys, ncu, nvprof)?
  • Как вы сравниваете две LLM архитектуры не по accuracy, а по efficiency?
  • Как вы сравниваете две модели, если у них разная latency (быстрая неточная vs медленная точная)?
  • Как вы тестируете видение модели (vision-language) на пропущенные детали?
  • Как вы управляете memory fragmentation при длительном раннинге LLM сервера?
  • Как выглядит process operational excellence в Harness Engineering (ORR, Operational Reviews)?
  • Как изменилась роль инженера с приходом Harness Engineering?
  • Как обрабатывать late-arriving data в ingestion?
  • Как проектировать retry storm mitigation (защита от лавинных ретраев)?
  • Как работает agent handover (передача задачи другому агенту)?
  • Как работает model extraction attack и как защититься?
  • Как сравнивать cost efficiency разных LLM провайдеров?
  • Как тестировать delegation paths (интеграционное тестирование multi-agent)?
  • Как устроена Memory в Harness (in-memory, fs, vector stores, relay)?
  • Какие есть стратегии распределённого кэширования для LLM (Redis Cluster, Memcached, Hazelcast)?
  • Какие инструменты (tools/functions) дать агенту для автоматизации бизнес-задач? (ваш кейс!)
  • Какое будущее у DSPy? Вытеснит ли он LangChain в 2026-2027?
  • Почему BF16 лучше FP16 для training?
  • Почему training 70B модели требует optimizer sharding (ZeRO-3)?
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Интегрировать OpenTelemetry в агента
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Написать postmortem для неудачного делегирования
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Написать тесты для меж-агентской коммуникации
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить Memory (in-memory + vector)
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить canary deployment промптов
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить recurrent memory для long context
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Рассчитать break-even point продукта
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать WAL для векторной БД
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать actor model для агентов
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать cost attribution per feature
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать failure injection для MoE router
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать fallback-цепь (Агент А → Агент Б → человек)
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать prompt linting
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать simulation testing для AI-агента
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Создать blameless postmortem template
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Создать blameless postmortem культуру
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Спроектировать onboarding для агента
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Сравнить reserved vs spot vs on-demand для ML-инфраструктуры
  • Что делать, если embedding pipeline отстаёт от ingestion (backpressure)?
  • Что такое Cost Engineering для LLM-систем?
  • Что такое GIM (Grounded Integration Measure) и чем он отличается от GPQA?
  • Что такое Guided Decoding и как оно связано с JSON schema?
  • Что такое Memory-optimized ANN и какие алгоритмы лучшие для ограниченной RAM (<16GB)?
  • Что такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)?
  • Что такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)?
  • Что такое prompt caching у провайдеров (Anthropic, Google) и как его использовать?
  • Что такое «message bus» для агентов (Kafka, NATS, Redis PubSub)?
  • Что такое «regression testing» для агентов (старый кейс сломался)?
  • Что такое «simulation testing» (тестирование в симулированной среде)?