…

Inference engine

Inference engine

Определение

Программная платформа для оптимизации выполнения модели на GPU.

Где встречается

318. TensorRT-LLM vs vLLM — сравнение для production deployment.

Навигация