LSTM
LSTM
Определение
Рекуррентная нейронная сеть с ячейками долгой краткосрочной памяти, способная эффективно моделировать последовательности и долгосрочные зависимости. Применяется в задачах обработки последовательностей, включая использование в draft-моделях.
Где встречается
- 164. Какие trade-offs между разными архитектурами speculative decoding
- 549. Как вы проектируете систему для real-time video understanding (поток с камеры)
- 656. Как работает кросс-энтропия (cross-entropy loss) для LLM обучения
- 713. Как работает Mamba (State Space Model) и чем она лучше трансформера
- 714. RWKV (RNN with Transformer attention) как комбинирует RNN и attention
- 718. Что такое Test-Time Training (TTT) слои и как они работают
- 800+ вопросов
- 57. Настроить recurrent memory для long context
- 72. Настроить capacity planning для GPU кластера