Knowledge Portal

aivaro.ru

  • Contents
  • Questions
  • Practice
  • Wiki
  • Tests
  • Search
✈Telegram @AetSeidhe
RUEN中文
…
Contents/Wiki/time

English translation is not available yet. Showing Russian content.

time

time

Определение

Утилита командной строки для измерения времени выполнения программы.

Где встречается

  • 29. Реализовать автоматический postmortem

Навигация

  • Индекс терминов
  • Индекс разборов
  • Оглавление

Теги

wikiтерминevaluationinference

Ссылки

  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать автоматический postmortem

Обратные ссылки (53)

  • В чем проблема «natural language bottleneck» для LLM?
  • Индекс терминов
  • Как вы делаете agent robustness к missing API (когда инструмент временно недоступен)?
  • Как вы делаете cache invalidation для semantic cache при обновлении знаний?
  • Как вы измеряете и оптимизируете TTFT (Time To First Token) и TPOT (Time Per Output Token)?
  • Как вы измеряете эффективность speculative decoding?
  • Как вы обрабатываете corrupted или empty документы в ingestion пайплайне?
  • Как вы обрабатываете ошибки агента (action не сработал, API вернул ошибку)?
  • Как вы проектируете Kafka топологии для RAG ingestion?
  • Как вы проектируете промпт для агента с инструментами?
  • Как вы реализуете streaming в production с учетом network limitations?
  • Как вы снижаете стоимость LLM в production на 50%+?
  • Как делать sandboxing для agent tools (изоляция выполнения)?
  • Как проектировать agent permissions (least privilege модель)?
  • Как проектировать distributed dead letter queue для сообщений?
  • Как проектировать аукцион для allocation вычислительных ресурсов между агентами?
  • Как работает graph optimization в LLM компиляторах (constant folding, dead code elimination)?
  • Как работают CUDA graphs и когда их использовать?
  • Как управлять dependency между промптами (один промпт вызывает другой)?
  • Как язык промпта (русский vs английский) влияет на схему рассуждения?
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Агент с наблюдаемостью (OpenTelemetry)
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить MCTS для математических задач
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить TTL для semantic cache
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить anomaly detection по cost
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить chunked prefill для long context (32k токенов, TTFT -60%)
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить correlation метрик (граф зависимостей retrieval → generation latency)
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить health checks для LLM
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить prompt observability
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить rate limiting на сообщения между агентами
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить tiered storage (hot/warm/cold)
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Профилировать GPU utilization падение
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Развернуть NCCL бенчмарк на 2-8 GPU
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализация partial harnessing для AI-агента
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать Bloom filter для retrieval
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать Session Management с TTL
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать WAL для векторной БД
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать compression сообщений
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать market-based делегирование
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать streaming с SSE в FastAPI для меж-агентной коммуникации
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать автоматический rollback промпта при падении faithfulness
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать роутер запросов между Groq и GPT-4 с делегированием по сложности
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Сравнить Hyena vs FlashAttention на 128k
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Сравнить S3 vs EBS для checkpoint'ов 70B
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Сравнить производительность NCCL ring и tree алгоритмов на разном масштабе GPU
  • Что такое Filtered ANN Search и как оно реализовано в Qdrant vs Weaviate?
  • Что такое IVF (Inverted File Index) и как он сравнивается с HNSW по speed/quality?
  • Что такое SLI (Service Level Indicators) для AI системы и как их собирать?
  • Что такое Semantic Caching и как вы его реализуете?
  • Что такое Wave Decoding и чем отличается от стандартного авторегрессивного?
  • Что такое skill libraries для агентов и как их создавать?
  • Что такое «dead letter queue» для сообщений агентов?
  • Что такое «regression testing» для агентов (старый кейс сломался)?
  • Что такое «simulation testing» (тестирование в симулированной среде)?