Knowledge Portal

aivaro.ru

  • Contents
  • Questions
  • Practice
  • Wiki
  • Tests
  • Search
✈Telegram @AetSeidhe
RUEN中文
…
Contents/Wiki/Invariant

English translation is not available yet. Showing Russian content.

Invariant

Invariant

Определение

Условие, которое должно выполняться для всех входных данных при property-based testing агентов.

Где встречается

  • 787. Как делать property-based testing для агентов

Навигация

  • Индекс терминов
  • Индекс разборов
  • Оглавление

Теги

wikiтерминagentsevaluation

Ссылки

  • Как делать property-based testing для агентов?

Обратные ссылки (47)

  • RWKV (RNN with Transformer attention): как комбинирует RNN и attention?
  • Индекс терминов
  • Как Harness Engineering помогает решить проблему "гарантий исполнения" в критических миссиях (mission-critical)?
  • Как LLM используются для code generation с формальной верификацией (Dafny, Lean)?
  • Как вы делаете blue-green deployment для RAG системы с zero downtime?
  • Как вы измеряете объяснимость (explainability) агентских решений?
  • Как вы калибруете вероятности LLM для classification задач?
  • Как вы оцениваете alignment модели с человеческими ценностями без gold standard?
  • Как вы оцениваете faithfulness ответа на длинном контексте (когда много информации)?
  • Как делать property-based testing для агентов?
  • Как измерять faithfulness для long-form ответов (1000+ токенов)?
  • Как обеспечивать exactly-once delivery между агентами?
  • Как проектировать graceful degradation при отказе vector DB?
  • Как происходит PII leakage через LLM и как защититься?
  • Как работает CLIP и как training contrastive loss выравнивает текст и изображения?
  • Как работает HNSW (Hierarchical Navigable Small World) алгоритм внутренне?
  • Как работает LayerNorm и RMSNorm? В чем разница и почему RMSNorm быстрее?
  • Как работает RoPE (Rotary Position Embedding) и чем лучше абсолютных позиций?
  • Как работает RoPE (Rotary Position Embeddings) для экстраполяции на длинные контексты?
  • Как работает YaRN (Yet another RoPE extensioN) для увеличения контекста?
  • Как работает sliding window attention в Mistral и Longformer?
  • Как работают agent swarms (рой агентов)?
  • Как работают verifier models для agentic RAG и зачем они нужны?
  • Как работают современные long-context LLM (GPT-4 1M, Claude 200k, Gemini 2M)?
  • Как тестировать robustness LLM к adversarial inputs?
  • Как тестировать агентов на недетерминированность?
  • Какие стратегии chunking'а вы знаете и когда какую применяете?
  • Когда SSM-архитектуры (Mamba, StripedHyena) лучше трансформеров для long context?
  • Почему gradient accumulation эквивалентен большому batch с точки зрения оптимизации?
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать swarm coordination (10 агентов, без центрального контроля)
  • Что такое "lost in the middle" и как это связано с attention sink?
  • Что такое AI for materials science (GNoME, MatterGen) и как это отличается от text LLM?
  • Что такое VCG auction (Vickrey-Clarke-Groves) и как он обеспечивает truthfulness?
  • Что такое agent explanation fidelity (насколько объяснение соответствует реальному решению)?
  • Что такое attention sink и почему он возникает в длинных контекстах?
  • Что такое calibration в контексте reward model для RLHF?
  • Что такое differential privacy для LLM и как она работает?
  • Что такое emergent specialization в multi-agent systems (агенты сами распределяют роли)?
  • Что такое graceful degradation в multi-agent системах?
  • Что такое idempotency в контексте LLM API и зачем она нужна?
  • Что такое idempotency в контексте LLM API и зачем она нужна?
  • Что такое mechanism design для multi-agent systems и как применить к LLM-агентам?
  • Что такое memory coalescing и почему оно важно для attention?
  • Что такое meta-evaluation бенчмарков (оценка оценки)?
  • Что такое position encoding? RoPE vs абсолютные позиции vs относительные позиции?
  • Что такое secure aggregation для федеративного обучения LLM?
  • Что такое индуктивные biases трансформеров? (positional invariance, order sensitivity)?