SIMT
SIMT
Определение
Модель выполнения GPU, где несколько потоков выполняют одну инструкцию на разных данных; лежит в основе warp.
Где встречается
- 302. Что такое warp divergence в CUDA и как он влияет на attention
- 704. Что такое bank conflicts в shared memory и как их избежать
- 711. Как работает speculative execution на GPU для LLM (branch prediction)
- 800+ вопросов