English translation is not available yet. Showing Russian content.

multi-GPU inference

multi-GPU inference

Определение

Запуск модели на нескольких GPU для уменьшения задержки или увеличения пропускной способности; при tensor parallelism узким местом может стать шина PCIe.

Где встречается

Навигация