transformers

Определение

Библиотека от Hugging Face для загрузки, обучения и инференса предобученных моделей на архитектуре Transformer, широко используемая в NLP и мультимодальных задачах.

Где встречается

24. Какой размер датасета нужен для fine-tuning
26. Как вы предотвращаете catastrophic forgetting при fine-tuning
28. Какие данные нужны для fine-tuning на кастомный стиль общения
29. Как fine-tune модель для следования сложным инструкциям
32. Как вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами
34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
36. Что такое DPO (Direct Preference Optimization) и чем отличается от RLHF
38. Как вы fine-tune модель для функции вызов внешнего API
59. n8n, Make, Zapier — как вы интегрируете их с LLM
75. Что такое structured output constrained decoding и зачем это нужно
90. Как вы проектируете API для внешних систем, использующих вашу LLM
102. Объясните концепцию «сигнатуры» (Signature) в DSPy. Чем она отличается от традиционного промпта
117. Какие embedding-модели для мультимодального поиска вы используете CLIP, BLIP-2, ImageBind
138. Что такое «оценка с подкреплением» (RLHF evaluation) и как она отличается от обычной
151. Что такое тест-тайм компьютинг (Test-Time Compute) и чем он отличается от обычного инференса
156. Как вы выбираете между увеличением тест-тайм компьютинга и использованием большей модели
157. Какие есть методы ускорения тест-тайм компьютинга (KV-cache, speculative decoding)
159. Как speculative decoding взаимодействует с KV cache
161. Как вы измеряете эффективность speculative decoding
164. Какие trade-offs между разными архитектурами speculative decoding
213. Что такое Guided Decoding и как оно связано с JSON schema
220. Как вы выбираете между online и batch инференсом для LLM
283. Что такое selective attention в контексте long context обработки
289. Как работает speculative decoding на уровне логитов, а не токенов
292. Как работает temperature sampling и как он влияет на качество при разных значениях
293. Что такое Top-p (nucleus) sampling и как он сочетается с temperature
294. Как вы калибруете вероятности LLM для classification задач
295. Что такое logit lens и как он помогает понимать внутренние представления
297. Что такое representation engineering (RepE) и зачем он нужен
299. Как работает attention между слоями (cross-layer attention) в современных архитектурах
326. Как работает RLHF (Reinforcement Learning from Human Feedback) технически
330. Что такое RLAIF (RL from AI Feedback) и как он масштабируется
340. Что такое Constitutional AI и как RLHF связан с ним
351. Как работает model stealing attack и как защититься
352. Что такое jailbreak taxonomy (OOD, refusal suppression, role-play, перевод)
357. Как работает membership inference атака на LLM
361. Как работает CLIP и как training contrastive loss выравнивает текст и изображения
362. Что такое Fuyu-8B и чем архитектурно отличается от GPT-4V
368. Как вы оцениваете мультимодальную модель на hallucinations (POPE, MMHal-Bench)
382. Как вы проектируете canary deployment для LLM модели

transformers

transformers

Определение

Где встречается

Навигация

transformers

transformers

Определение

Где встречается

Навигация