English translation is not available yet. Showing Russian content.
graph optimization
graph optimization
Определение
Набор техник (fusion, constant folding, layout optimization, memory pattern), применяемых к вычислительному графу модели для уменьшения времени выполнения и использования памяти. Ключевая техника в LLM компиляторах и ONNX Runtime.
Где встречается
- 320. Что такое ONNX Runtime и когда он выгоден для LLM
- 321. Как работает graph optimization в LLM компиляторах (constant folding, dead code elimination)
- 800+ вопросов