English translation is not available yet. Showing Russian content.
padded sequences
padded sequences
Определение
Последовательности, дополненные pad-токенами до фиксированной длины для обработки в батче. Приводят к потере вычислительных ресурсов и warp divergence в attention.
Где встречается
- 32. Как вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами
- 34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
- 302. Что такое warp divergence в CUDA и как он влияет на attention
- 318. TensorRT-LLM vs vLLM — сравнение для production deployment.
- 319. Как работает XLA (Accelerated Linear Algebra) для LLM на TPU
- 467. Что такое packing sequences и зачем он нужен
- 473. Что такое torch.compile и как он ускоряет training
- 476. Как работает packing для variable-length sequences в FSDP
- 704. Что такое bank conflicts в shared memory и как их избежать
- 800+ вопросов
- 56. Реализовать diffusion LLM (PLANNER)