CUDA streams

CUDA streams

Определение

Упорядоченные очереди операций на GPU, позволяющие параллельно выполнять kernel computation и data transfer. Использование нескольких concurrent streams даёт возможность оверлапить compute и communication, что критично для инференса в реальном времени.

Где встречается

Навигация