Knowledge Portal

aivaro.ru

  • Оглавление
  • Вопросы
  • Практика
  • Вики
  • Тесты
  • Поиск
✈Telegram @AetSeidhe
RUEN中文
…
Оглавление/Вики/stability

stability

stability

Определение

Stability — важная характеристика representation при повторных запусках

Где встречается

  • 800+ вопросов

Навигация

  • Индекс терминов
  • Индекс разборов
  • Оглавление

Теги

wikiтерминevaluation

Обратные ссылки (22)

  • GRPO (Group Relative Policy Optimization) vs PPO — чем отличается и зачем нужен?
  • LangChain vs LlamaIndex vs Haystack — что выберете и почему?
  • Индекс терминов
  • Как вы измеряете объяснимость (explainability) агентских решений?
  • Как вы оцениваете качество language representation для задачи?
  • Как вы планируете масштабирование команды вокруг LLM-системы?
  • Как вы тестируете агента на «неожиданные input» (не только adversarial, но и просто странные)?
  • Как делать rollback промпта (auto-rollback при деградации метрик)?
  • Как избежать hot shard в Qdrant (или другой векторной БД)?
  • Как проектировать rate limiting на уровне сообщений?
  • Как работает Direct Preference Optimization (DPO) в деталях (потеря, градиенты)?
  • Как работает YaRN (Yet another RoPE extensioN) для увеличения контекста?
  • Как работает diffusion backends для генерации изображений в AI-агентах?
  • Как работает алгоритм ReST (Reinforced Self-Training) и когда он лучше PPO?
  • Почему small batch size (<32) ухудшает training стабильность?
  • Почему vLLM быстрее TGI (Hugging Face Text Generation Inference)?
  • Что такое AI for materials science (GNoME, MatterGen) и как это отличается от text LLM?
  • Что такое hybrid search с весами (weighted hybrid) и как оптимизировать веса?
  • Что такое skill libraries для агентов и как их создавать?
  • Что такое streaming LLM для бесконечного контекста (техника rollback)?
  • Что такое vanishing / exploding gradients в трансформерах и как их предотвратить?
  • Что такое «Schema-Activated In-Context Learning» (SA-ICL)?