中文翻译暂不可用,显示俄语原文。

multi-GPU inference

multi-GPU inference

Определение

Запуск модели на нескольких GPU для уменьшения задержки или увеличения пропускной способности; при tensor parallelism узким местом может стать шина PCIe.

Где встречается

Навигация