English translation is not available yet. Showing Russian content.
GPT-3
GPT-3
Определение
Крупная языковая модель от OpenAI, использующая pre-norm, часто применяемая как пример для ускорения инференса и изучения dropout в pre-training.
Где встречается
- 164. Какие trade-offs между разными архитектурами speculative decoding
- 675. Как работает dropout и зачем он нужен в LLM (regularization)
- 800+ вопросов