Knowledge Portal

aivaro.ru

  • Оглавление
  • Вопросы
  • Практика
  • Вики
  • Тесты
  • Поиск
✈Telegram @AetSeidhe
RUEN中文
…
Оглавление/Вики/V100

V100

V100

Определение

Графический процессор NVIDIA с NVLink 2.0 (300 ГБ/с), исторически применявшийся для ускорения инференса и обучения моделей.

Где встречается

  • 307. Как PCIe bottleneck проявляется в multi-GPU инференсе
  • 4. Настроить GPU Direct RDMA

Навигация

  • Индекс терминов
  • Индекс разборов
  • Оглавление

Теги

wikiтерминarchitecture

Ссылки

  • Как PCIe bottleneck проявляется в multi-GPU инференсе?
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить GPU Direct RDMA

Обратные ссылки (7)

  • Индекс терминов
  • Как вы оптимизируете embedding генерацию для большого количества документов?
  • Как работает Tensor Core microarchitecture (WGMMA, MMA инструкции) в H100?
  • Как работает warp scheduling на NVIDIA GPU и как это влияет на LLM kernels?
  • Как работают Tensor Cores в H100/B200 и для чего они нужны?
  • ТЕХНИЧЕСКОЕ ЗАДАНИЕ: Развернуть NCCL бенчмарк на 2-8 GPU
  • Что такое FP16, BF16, FP8, INT8 quantization? Когда что использовать?