中文翻译暂不可用,显示俄语原文。
compute-communication overlap
compute-communication overlap
Определение
Техника ускорения за счёт параллельного выполнения вычислений и передачи данных на GPU с использованием CUDA streams; позволяет скрыть latency копирования данных.
Где встречается
- 308. Как работают CUDA streams и как они помогают оверлапить compute и communication
- 544. Как вы строите real-time voice agent с latency 500ms
- 707. Как работает asynchronous execution на Hopper (copy engine vs compute)
- 863. Как проектировать Airflow DAG для RAG ingestion
- Практика
- 800+ вопросов
- 227. RAG с гибридным поиском