Temperature

Определение

Гиперпараметр LLM, контролирующий случайность генерации: низкие значения (около 0) делают вывод детерминированным, высокие — увеличивают разнообразие и креативность ответов.

Где встречается

11. Что такое Hypothetical Document Embeddings (HyDE) и зачем
17. Как вы уменьшаете галлюцинации в RAG
35. Как вы fine-tune embedding модель под свой домен (а не используете готовую)
49. Как вы дебажите агента, который делает неправильные действия
62. Какие метрики вы мониторите для LLM в production
87. Как вы обеспечиваете, чтобы ответы LLM были консистентными для одинаковых вопросов
90. Как вы проектируете API для внешних систем, использующих вашу LLM
102. Объясните концепцию «сигнатуры» (Signature) в DSPy. Чем она отличается от традиционного промпта
132. Как вы калибруете LLM-судью под человеческие оценки
172. Что такое LiveIdeaBench и для чего он нужен
173. Как вы оцениваете креативность LLM в production
178. Чем отличается эвалюация LLM от эвалюации традиционных ML моделей
249. Как вы делаете load shedding при перегрузке LLM сервера
291. Как вы измеряете uncertainty в ответах LLM (logit-based vs ensemble methods)
292. Как работает temperature sampling и как он влияет на качество при разных значениях
293. Что такое Top-p (nucleus) sampling и как он сочетается с temperature
294. Как вы калибруете вероятности LLM для classification задач
320. Что такое ONNX Runtime и когда он выгоден для LLM
335. Как работает Direct Preference Optimization (DPO) в деталях (потеря, градиенты)
348. Что такое calibration ошибок модели и как ее измерять (ECE, MCE, Brier score)
357. Как работает membership inference атака на LLM
361. Как работает CLIP и как training contrastive loss выравнивает текст и изображения
363. Как работает Whisper (architecture, tokenization, training) для ASR
375. Как вы калибруете retrieval confidence для threshold-based filtering
397. Как вы делаете агента, который может «просить помощи» у другого агента или человека
406. Что такое idempotency в контексте LLM API и зачем она нужна
487. Что такое calibration ошибок модели и как ее измерять (ECE, MCE, Brier score)
498. Что такое meta-evaluation бенчмарков (оценка оценки)
543. Как работает Whisper архитектурно для ASR (Automatic Speech Recognition)
579. Как работает agent replay для улучшения качества (анализ failed траекторий)
587. Как работает agent with external tool verification (проверка результатов API)
596. Как работает model stealing attack (экстракция модели через API)
602. Как работает membership inference атака на LLM
619. Как работает LLM fingerprinting (идентификация модели по ответам)
622. Как работает membership inference через logits (разница в вероятностях)
627. Как вы тестируете long-context capability модели (бенчмарки RULER, Needle in a Haystack)
652. Почему в формуле attention нужно делить на √d_k Что будет без масштабирования
657. Что такое KL divergence и где она применяется в LLM (RLHF, distillation)
661. Как работает softmax и почему он вызывает проблемы с градиентами при больших logits
662. Что такое logits и как они связаны с вероятностями temperature scaling

Temperature

Temperature

Определение

Где встречается

Навигация

Temperature

Temperature

Определение

Где встречается

Навигация