Knowledge Portal

aivaro.ru

  • 目录
  • 问题
  • 实践
  • 百科
  • 测试
  • 搜索
✈Telegram @AetSeidhe
RUEN中文
…
目录/百科/quality

中文翻译暂不可用,显示俄语原文。

quality

quality

Определение

Обобщённая оценка качества ответов модели, часто требующая ручной или автоматической валидации, сравнивается с baseline для определения улучшения.

Где встречается

  • Практика

Навигация

  • Индекс терминов
  • Индекс разборов
  • Оглавление

Теги

wikiтерминevaluation

Обратные ссылки (12)

  • EAGLE-3 vs Medusa-2 vs Hydra: сравнение speculative decoding методов?
  • Индекс терминов
  • Как fine-tune модель для следования сложным инструкциям?
  • Как вы обновляете embedding модель без полной переиндексации?
  • Как вы проводите A/B тест метрик качества (не бизнес-метрик)?
  • Как работает speculative decoding? Как выбрать draft модель?
  • Как тест-тайм компьютинг меняет MLOps?
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить recurrent memory для long context
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настройка AWQ квантизации для LLM
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать market-based делегирование
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Сравнить cost efficiency провайдеров LLM (GPT-4 vs Claude vs Llama-3 self-hosted)
  • Что такое SLI (Service Level Indicators) для AI системы и как их собирать?