中文翻译暂不可用,显示俄语原文。
OpenAI Triton Inference Server
OpenAI Triton Inference Server
Определение
Сервер инференса, позволяющий реализовать кастомные планировщики для continuous batching и оптимизации вывода моделей.
中文翻译暂不可用,显示俄语原文。
Сервер инференса, позволяющий реализовать кастомные планировщики для continuous batching и оптимизации вывода моделей.