Knowledge Portal

aivaro.ru

  • Оглавление
  • Вопросы
  • Практика
  • Вики
  • Тесты
  • Поиск
✈Telegram @AetSeidhe
RUEN中文
…
Оглавление/Вики/8-bit

8-bit

8-bit

Определение

Квантование весов модели до 8-битных чисел (INT8) для снижения потребления памяти и ускорения инференса за счёт небольшой потери точности.

Где встречается

  • 64. Настроить self-consistency для CoT

Навигация

  • Индекс терминов
  • Индекс разборов
  • Оглавление

Теги

wikiтерминinference

Ссылки

  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить self-consistency для CoT

Обратные ссылки (2)

  • Индекс терминов
  • Почему 4-bit inference иногда медленнее 8-bit?