Knowledge Portal

aivaro.ru

  • Оглавление
  • Вопросы
  • Практика
  • Вики
  • Тесты
  • Поиск
✈Telegram @AetSeidhe
RUEN中文
…
Оглавление/Вики/quality

quality

quality

Определение

Обобщённая оценка качества ответов модели, часто требующая ручной или автоматической валидации, сравнивается с baseline для определения улучшения.

Где встречается

  • Практика

Навигация

  • Индекс терминов
  • Индекс разборов
  • Оглавление

Теги

wikiтерминevaluation

Обратные ссылки (12)

  • EAGLE-3 vs Medusa-2 vs Hydra: сравнение speculative decoding методов?
  • Индекс терминов
  • Как fine-tune модель для следования сложным инструкциям?
  • Как вы обновляете embedding модель без полной переиндексации?
  • Как вы проводите A/B тест метрик качества (не бизнес-метрик)?
  • Как работает speculative decoding? Как выбрать draft модель?
  • Как тест-тайм компьютинг меняет MLOps?
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить recurrent memory для long context
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настройка AWQ квантизации для LLM
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать market-based делегирование
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Сравнить cost efficiency провайдеров LLM (GPT-4 vs Claude vs Llama-3 self-hosted)
  • Что такое SLI (Service Level Indicators) для AI системы и как их собирать?