中文翻译暂不可用,显示俄语原文。
Hopper GPU
Hopper GPU
Определение
Микроархитектура GPU, поддерживающая WGMMA и TMA для ускорения FlashAttention-3; используется для высокопроизводительного инференса LLM.
Где встречается
- 205. Как вы деплоите LLM с requirement 100ms latency при throughput 1000 reqs Архитектура.
- 800+ вопросов