English translation is not available yet. Showing Russian content.

llama.cpp

llama.cpp

Определение

Фреймворк для локального запуска LLM на CPU/GPU с квантованием, использует формат GGUF. Лёгкий инференс с batch processing.

Где встречается

Навигация