English translation is not available yet. Showing Russian content.
one-hot
one-hot
Определение
значения стремятся к one-hot (почти 0 или 1).
Где встречается
- 656. Как работает кросс-энтропия (cross-entropy loss) для LLM обучения
- 661. Как работает softmax и почему он вызывает проблемы с градиентами при больших logits
- 800+ вопросов
- 56. Реализовать diffusion LLM (PLANNER)
- 67. Реализовать latent reasoning (∇-Reasoner)