Temperature
Temperature
Определение
Гиперпараметр LLM, контролирующий случайность генерации: низкие значения (около 0) делают вывод детерминированным, высокие — увеличивают разнообразие и креативность ответов.
Где встречается
- 11. Что такое Hypothetical Document Embeddings (HyDE) и зачем
- 17. Как вы уменьшаете галлюцинации в RAG
- 35. Как вы fine-tune embedding модель под свой домен (а не используете готовую)
- 49. Как вы дебажите агента, который делает неправильные действия
- 62. Какие метрики вы мониторите для LLM в production
- 87. Как вы обеспечиваете, чтобы ответы LLM были консистентными для одинаковых вопросов
- 90. Как вы проектируете API для внешних систем, использующих вашу LLM
- 102. Объясните концепцию «сигнатуры» (Signature) в DSPy. Чем она отличается от традиционного промпта
- 132. Как вы калибруете LLM-судью под человеческие оценки
- 172. Что такое LiveIdeaBench и для чего он нужен
- 173. Как вы оцениваете креативность LLM в production
- 178. Чем отличается эвалюация LLM от эвалюации традиционных ML моделей
- 249. Как вы делаете load shedding при перегрузке LLM сервера
- 291. Как вы измеряете uncertainty в ответах LLM (logit-based vs ensemble methods)
- 292. Как работает temperature sampling и как он влияет на качество при разных значениях
- 293. Что такое Top-p (nucleus) sampling и как он сочетается с temperature
- 294. Как вы калибруете вероятности LLM для classification задач
- 320. Что такое ONNX Runtime и когда он выгоден для LLM
- 335. Как работает Direct Preference Optimization (DPO) в деталях (потеря, градиенты)
- 348. Что такое calibration ошибок модели и как ее измерять (ECE, MCE, Brier score)
- 357. Как работает membership inference атака на LLM
- 361. Как работает CLIP и как training contrastive loss выравнивает текст и изображения
- 363. Как работает Whisper (architecture, tokenization, training) для ASR
- 375. Как вы калибруете retrieval confidence для threshold-based filtering
- 397. Как вы делаете агента, который может «просить помощи» у другого агента или человека
- 406. Что такое idempotency в контексте LLM API и зачем она нужна
- 487. Что такое calibration ошибок модели и как ее измерять (ECE, MCE, Brier score)
- 498. Что такое meta-evaluation бенчмарков (оценка оценки)
- 543. Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)
- 579. Как работает agent replay для улучшения качества (анализ failed траекторий)
- 587. Как работает agent with external tool verification (проверка результатов API)
- 596. Как работает model stealing attack (экстракция модели через API)
- 602. Как работает membership inference атака на LLM
- 619. Как работает LLM fingerprinting (идентификация модели по ответам)
- 622. Как работает membership inference через logits (разница в вероятностях)
- 627. Как вы тестируете long-context capability модели (бенчмарки RULER, Needle in a Haystack)
- 652. Почему в формуле attention нужно делить на √d_k Что будет без масштабирования
- 657. Что такое KL divergence и где она применяется в LLM (RLHF, distillation)
- 661. Как работает softmax и почему он вызывает проблемы с градиентами при больших logits
- 662. Что такое logits и как они связаны с вероятностями temperature scaling