XLA
XLA
Определение
Компилятор машинного обучения от Google, оптимизирующий графы вычислений для ускорителей (TPU, GPU). Выполняет слияние операций (fusion), постоянное свёртывание и даёт прирост скорости по сравнению с eager-исполнением.
Где встречается
- 321. Как работает graph optimization в LLM компиляторах (constant folding, dead code elimination)
- 322. Что такое operator fusion в компиляторах и какие паттерны fusion существуют
- 324. Что такое TVM (Apache TVM) и зачем он нужен для AI инференса
- 325. Как вы сравниваете разные компиляторы (TensorRT, IREE, XLA) для вашей модели
- 800+ вопросов