InfiniBand
InfiniBand
Определение
Высокоскоростная сетевая технология (до 400 ГБ/с) для соединения GPU-узлов в кластере, альтернатива Ethernet с меньшей задержкой.
Где встречается
- 205. Как вы деплоите LLM с requirement 100ms latency при throughput 1000 reqs Архитектура.
- 307. Как PCIe bottleneck проявляется в multi-GPU инференсе
- 314. Как работает NVLink Switch System на DGX H100
- 402. Что такое NCCL и почему он критичен для multi-GPU инференса
- 424. Что такое pipeline parallelism и проблема pipeline bubbles
- 425. Как работает sequence parallelism в контексте LLM
- 426. Что такое 3D parallelism (data + tensor + pipeline)
- 461. Почему training 70B модели требует optimizer sharding (ZeRO-3)
- 462. ZeRO-1 vs ZeRO-2 vs ZeRO-3 что и когда использовать
- 471. Как работает FSDP (Fully Sharded Data Parallel) в PyTorch
- Практика
- 800+ вопросов
- 2. Написать RDMA-читалку для KV cache
- 4. Настроить GPU Direct RDMA
- 5. Сравнить NCCL ring vs tree
- 8. Настроить InfiniBand partition keys
- 9. Профилировать network congestion на 64 GPU