Intel Neural Compressor
Intel Neural Compressor
Определение
Intel Neural Compressor — это инструмент с открытым исходным кодом от Intel для сжатия и оптимизации моделей машинного обучения. Он поддерживает различные техники, включая квантование, прунинг и дистилляцию, позволяя уменьшить размер модели и ускорить её инференс на оборудовании Intel.