OpenTelemetry
OpenTelemetry
Определение
Стандарт и набор инструментов для сбора трассировок, метрик и логов в распределённых системах. Обеспечивает единообразный сбор телеметрии с возможностью экспорта в различные бэкенды (Jaeger, Prometheus и другие).
Где встречается
- 41. LangChain vs LlamaIndex vs Haystack — что выберете и почему
- 73. Как вы логируете все вызовы LLM для аудита
- 82. Как бы вы спроектировали систему для реального времени (real-time) обработки документов
- 90. Как вы проектируете API для внешних систем, использующих вашу LLM
- 165. Как тест-тайм компьютинг меняет MLOps
- 241. Как вы делаете distributed tracing для цепочки user → gateway → RAG → LLM → user
- 253. Как вы делаете асинхронную обработку long-running (30s) LLM задач
- 265. Как вы проектируете data lineage для RAG (от документа к ответу)
- 388. Что такое SLI (Service Level Indicators) для AI системы и как их собирать
- 392. Что такое «agentic mesh» (сеть взаимодействующих агентов) и как вы его дебажите
- 393. Как вы измеряете «cost of reasoning» у агента (не только токены, но и шаги, время, ошибки)
- 408. Как вы делаете distributed tracing для цепочки user → gateway → RAG → LLM → user
- 413. Что такое sidecar pattern для LLM observability и как его реализовать
- 744. Что такое Agent Loop и какие компоненты входят в production-ready loop
- 753. Что такое Coordination Engineering и чем он отличается от Harness Engineering
- 754. Как Harness Engineering связан с наблюдаемостью (OpenTelemetry, LangSmith, трассировка)
- 758. Как вы проектируете Harness для mission-critical приложения Приведите пример с агентом для банковских переводов.
- 765. Как измерять «стоимость делегирования» (токены + время + деньги)
- 769. Как тестировать delegation paths (интеграционное тестирование multi-agent)
- 807. Что такое «prompt observability» (мониторинг эффективности промптов в production)
- 824. Как организовать distributed tracing для agent pipeline
- 828. Как проектировать distributed locking для LLM agents
- 887. Как проектировать agent permissions (least privilege модель)
- 896. Как сделать агента самовосстанавливающимся (self-healing)
- Практика
- 800+ вопросов
- 21. Интегрировать OpenTelemetry в RAG
- 24. Настроить RED metrics для LLM
- 30. Настроить correlation между метриками
- 103. Интегрировать OpenTelemetry в агента
- 113. Собрать agentic mesh из 3 агентов
- 119. Измерить cost делегирования
- 129. Настроить monitoring delegation
- 184. Настроить distributed tracing
- 194. Настроить distributed tracing через OpenTelemetry
- 246. Агент с наблюдаемостью (OpenTelemetry)
- 247. RAG с distributed tracing
- 250. Полный production агент
- 254. Реализовать SLO для RAG
- 255. Настроить correlation метрик