Knowledge Portal

aivaro.ru

  • Оглавление
  • Вопросы
  • Практика
  • Вики
  • Тесты
  • Поиск
✈Telegram @AetSeidhe
RUEN中文
…
Оглавление/Вики/JAX

JAX

JAX

Определение

Фреймворк от Google с JIT-компиляцией, применяемый для высокопроизводительных вычислений и инференса моделей.

Где встречается

  • 324. Что такое TVM (Apache TVM) и зачем он нужен для AI инференса

Навигация

  • Индекс терминов
  • Индекс разборов
  • Оглавление

Теги

wikiтерминarchitectureinference

Ссылки

  • Что такое TVM (Apache TVM) и зачем он нужен для AI инференса?

Обратные ссылки (8)

  • Бенчмаркинг LLM на AMD MI300X vs H100: различия в архитектуре и оптимизации?
  • Индекс терминов
  • Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели?
  • Как работает XLA (Accelerated Linear Algebra) для LLM на TPU?
  • Что такое FP16, BF16, FP8, INT8 quantization? Когда что использовать?
  • Что такое MLIR и как он используется в IREE/TensorRT-LLM?
  • Что такое ONNX Runtime и когда он выгоден для LLM?
  • Что такое differential privacy для LLM и как она работает?