Hugging Face
Hugging Face
Определение
Платформа и библиотеки (Transformers, TRL, PEFT) для работы с предобученными NLP-моделями, датасетами и реализации RLHF.
Где встречается
- 35. Как вы fine-tune embedding модель под свой домен (а не используете готовую)
- 78. Какие LLM для русского языка вы используете
- 87. Как вы обеспечиваете, чтобы ответы LLM были консистентными для одинаковых вопросов
- 101. Что такое DSPy и какую проблему он решает, которую не решают LangChain или LlamaIndex
- 233. Как вы делаете hybrid search (vector + keyword) в production на 10M документов
- 318. TensorRT-LLM vs vLLM — сравнение для production deployment.
- 324. Что такое TVM (Apache TVM) и зачем он нужен для AI инференса
- 326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически
- 336. Что такое KTO (Kahneman-Tversky Optimization) и чем отличается от DPO
- 432. Как работает FlashAttention-3 технически Чем отличается от FA2
- 530. Как вы делаете data quality monitoring для RAG корпуса
- 537. Что такое SigLIP и чем отличается от CLIP
- 540. Как работает Q-Former в BLIP-2 и зачем он нужен
- 838. Как speculative decoding ускоряет inference (детально)
- 858. Как проектировать ETL vs ELT для RAG
- 52. Настроить RWKV для инференса
- 92. Профилировать GPU utilization падение
- 94. Реализовать failure injection для MoE router
- 163. Реализовать AB тестирование промптов
- 169. Реализовать rollback промпта
- 238. RAG с incremental update