Knowledge Portal

aivaro.ru

  • Оглавление
  • Вопросы
  • Практика
  • Вики
  • Тесты
  • Поиск
✈Telegram @AetSeidhe
RUEN中文
…
Оглавление/Вики/load time

load time

load time

Определение

Время загрузки checkpoint модели, измеряемое для крупных моделей (например, 140 ГБ) при сравнении носителей S3 и EBS.

Где встречается

  • Практика

Навигация

  • Индекс терминов
  • Индекс разборов
  • Оглавление

Теги

wikiтерминinference

Обратные ссылки (7)

  • Индекс терминов
  • Как вы делаете health check для LLM сервера с учетом модели (не только процесс)?
  • Как вы сравниваете две LLM архитектуры не по accuracy, а по efficiency?
  • Как работает whisper.cpp для локального ASR с low latency?
  • Почему MoE (Mixture of Experts) быстрее dense модели при инференсе?
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Конвертировать датасет из JSONL в Parquet
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить sharding для petabyte embeddings