transformers
transformers
Определение
Библиотека от Hugging Face для загрузки, обучения и инференса предобученных моделей на архитектуре Transformer, широко используемая в NLP и мультимодальных задачах.
Где встречается
- 24. Какой размер датасета нужен для fine-tuning
- 26. Как вы предотвращаете catastrophic forgetting при fine-tuning
- 28. Какие данные нужны для fine-tuning на кастомный стиль общения
- 29. Как fine-tune модель для следования сложным инструкциям
- 32. Как вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами
- 34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
- 36. Что такое DPO (Direct Preference Optimization) и чем отличается от RLHF
- 38. Как вы fine-tune модель для функции вызов внешнего API
- 59. n8n, Make, Zapier — как вы интегрируете их с LLM
- 75. Что такое structured output constrained decoding и зачем это нужно
- 90. Как вы проектируете API для внешних систем, использующих вашу LLM
- 102. Объясните концепцию «сигнатуры» (Signature) в DSPy. Чем она отличается от традиционного промпта
- 117. Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind
- 138. Что такое «оценка с подкреплением» (RLHF evaluation) и как она отличается от обычной
- 151. Что такое тест-тайм компьютинг (Test-Time Compute) и чем он отличается от обычного инференса
- 156. Как вы выбираете между увеличением тест-тайм компьютинга и использованием большей модели
- 157. Какие есть методы ускорения тест-тайм компьютинга (KV-cache, speculative decoding)
- 159. Как speculative decoding взаимодействует с KV cache
- 161. Как вы измеряете эффективность speculative decoding
- 164. Какие trade-offs между разными архитектурами speculative decoding
- 213. Что такое Guided Decoding и как оно связано с JSON schema
- 220. Как вы выбираете между online и batch инференсом для LLM
- 283. Что такое selective attention в контексте long context обработки
- 289. Как работает speculative decoding на уровне логитов, а не токенов
- 292. Как работает temperature sampling и как он влияет на качество при разных значениях
- 293. Что такое Top-p (nucleus) sampling и как он сочетается с temperature
- 294. Как вы калибруете вероятности LLM для classification задач
- 295. Что такое logit lens и как он помогает понимать внутренние представления
- 297. Что такое representation engineering (RepE) и зачем он нужен
- 299. Как работает attention между слоями (cross-layer attention) в современных архитектурах
- 326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически
- 330. Что такое RLAIF (RL from AI Feedback) и как он масштабируется
- 340. Что такое Constitutional AI и как RLHF связан с ним
- 351. Как работает model stealing attack и как защититься
- 352. Что такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)
- 357. Как работает membership inference атака на LLM
- 361. Как работает CLIP и как training contrastive loss выравнивает текст и изображения
- 362. Что такое Fuyu-8B и чем архитектурно отличается от GPT-4V
- 368. Как вы оцениваете мультимодальную модель на hallucinations (POPE, MMHal-Bench)
- 382. Как вы проектируете canary deployment для LLM модели