中文翻译暂不可用,显示俄语原文。
predicated instructions
predicated instructions
Определение
Инструкции GPU (например, SELP), которые вычисляют оба результата и выбирают нужный по предикату без явного ветвления. Используются для минимизации warp divergence в LLM kernels.
Где встречается
- 302. Что такое warp divergence в CUDA и как он влияет на attention
- 711. Как работает speculative execution на GPU для LLM (branch prediction)
- 800+ вопросов