English translation is not available yet. Showing Russian content.

GGUF

GGUF

Определение

Формат квантизации моделей, оптимизированный для инференса на CPU и edge-устройствах (например, через llama.cpp). Поддерживает 2-8 битное квантование, обеспечивая компромисс между размером, скоростью и качеством.

Где встречается

Навигация