中文翻译暂不可用,显示俄语原文。

VLLM

VLLM

Определение

Библиотека для высокопроизводительного инференса LLM, использующая Paged Attention и continuous batching для эффективного использования GPU памяти и увеличения пропускной способности.

Где встречается

Навигация