English translation is not available yet. Showing Russian content.
GPT-2
GPT-2
Определение
Языковая модель от OpenAI с пост-нормализацией, часто используемая как небольшая модель для демонстраций, fine-tuning и исследований вроде RLHF.
Где встречается
- 29. Как fine-tune модель для следования сложным инструкциям
- 78. Какие LLM для русского языка вы используете
- 138. Что такое «оценка с подкреплением» (RLHF evaluation) и как она отличается от обычной
- 293. Что такое Top-p (nucleus) sampling и как он сочетается с temperature
- 326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически
- 336. Что такое KTO (Kahneman-Tversky Optimization) и чем отличается от DPO
- 838. Как speculative decoding ускоряет inference (детально)
- 800+ вопросов
- 52. Настроить RWKV для инференса
- 57. Настроить recurrent memory для long context
- 60. Настроить гибрид (Mamba + Attention)
- 220. Настроить wave decoding для коротких ответов