English translation is not available yet. Showing Russian content.
predicated instructions
predicated instructions
Определение
Инструкции GPU (например, SELP), которые вычисляют оба результата и выбирают нужный по предикату без явного ветвления. Используются для минимизации warp divergence в LLM kernels.
Где встречается
- 302. Что такое warp divergence в CUDA и как он влияет на attention
- 711. Как работает speculative execution на GPU для LLM (branch prediction)
- 800+ вопросов