中文翻译暂不可用,显示俄语原文。

GGUF

GGUF

Определение

Формат квантизации моделей, оптимизированный для инференса на CPU и edge-устройствах (например, через llama.cpp). Поддерживает 2-8 битное квантование, обеспечивая компромисс между размером, скоростью и качеством.

Где встречается

Навигация