Поиск
- wikiIntra-list diversity
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiElaboration
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[800+ вопросов|800+ вопросов]] ## Навигация…
- wikiself-BLEU
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[331. Как вы измеряете quality…
- wikiгибкость
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[800+ вопросов|800+ вопросов]] ## Навигация…
- wikiбеглость
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[800+ вопросов|800+ вопросов]] ## Навигация…
- wikiоригинальность
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[800+ вопросов|800+ вопросов]] ## Навигация…
- wikiSemantic distance
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[800+ вопросов|800+ вопросов]] - [[267…
- wikiNovelty
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[690. Как вы измеряете diversity…
- wikisilhouette score
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[690. Как вы измеряете diversity…
- wikipresence penalty
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[679. Что такое repetition penalty…
- answerКак вы оцениваете креативность LLM в production?
…Креативность LLM в production Креативность [[Вики/LLM\|LLM]] — [[Вики/способность модели\|способность модели]] генерировать новые, разнообразные и полезные идеи, тексты…
- wikifrequency penalty
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[293. Что такое Top-p…
- answerЧто такое LiveIdeaBench и для чего он нужен?
…Зачем оценивать креативность LLM? Традиционные [[Вики/Benchmarks\|бенчмарки]] ([[Вики/MMLU\|MMLU]], [[Вики/GSM8K\|GSM8K]], [[Вики/HumanEval\|HumanEval]]) измеряют intelligence — способность…
- wikiDistinct-N
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[293. Что такое Top-p…
- wikiBIG-bench
# BIG-bench ## Определение Набор бенчмарков для оценки LLM, включающий задачи на креативность и проверку construct validity модели. ## Где встречается - [[172…
- wikiK-means
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[177. Как вы измеряете дрейф…
- wikiOpenAI API
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[188. Что такое «Schema-Activated…
- wikiTop-p (nucleus) sampling
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[292. Как работает temperature sampling…
- wikiscikit-learn
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[178. Чем отличается эвалюация LLM…
- wikiStreamlit
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[178. Чем отличается эвалюация LLM…
- wikiTemperature
# Temperature ## Определение Гиперпараметр LLM, контролирующий случайность генерации: низкие значения (около 0) делают вывод детерминированным, высокие — увеличивают разнообразие и креативность ответов…
- wikiпромпт агента
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[182. Что такое «схема» (schema…
- wikiA/B testing
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[178. Чем отличается эвалюация LLM…
- wikiAgentic RAG
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[174. Что такое «многошаговая когерентность…
- wikiLLM-as-a-judge
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[176. Какие инструменты для агентской…
- wikisentence-transformers
…Как вы оцениваете креативность LLM в production|173. Как вы оцениваете креативность LLM в production]] - [[192. Как вы оцениваете качество…
- answerЧто такое IRT (Item Response Theory) и как она применяется к LLM эвалюации?
…Что такое LiveIdeaBench и для чего он нужен\|172]] | Как проводить человеческую эвалюацию LLM? | | [[173. Как вы оцениваете креативность LLM…
- answerЧто такое «многошаговая когерентность» (coherence illusion) в cascading agent systems?
…Как вы оцениваете креативность LLM в production\|173]] | Cascading agent systems: архитектура и риски | | [[175. Как детектировать «объяснительно-решенческую декомпозицию…
- answerКак работает greedy decoding vs beam search vs sampling?
…точностью, креативностью и вычислительной стоимостью, что критически важно для задач RAG и AI-агентов. --- ## 1. Термин: Декодирование в LLM [[Вики…
- answerКогда DSPy *не* подходит? Назовите 3 сценария.
…shot examples\|few-shot примеры]] могут только ограничить креативность [[Вики/LLM\|LLM]], заставляя её копировать стиль датасета. ### 4.3 Альтернативы…
- answerЧто такое Top-p (nucleus) sampling и как он сочетается с temperature?
…Что такое temperature в контексте LLM **[[Вики/Temperature\|Temperature]]** — гиперпараметр, контролирующий «креативность» генерации. Математически: [[Вики/logits\|логиты]] делятся на [[Вики…
- answerАльтернативы LLM-as-Judge — назовите 3 и их ограничения?
…зачем нужны альтернативы LLM-as-Judge **[[Вики/LLM-as-a-judge\|LLM-as-Judge]]** — подход, при котором [[Вики/LLM\|большая…
- answerКак работает LLM fingerprinting (идентификация модели по ответам)?
…Как работает LLM fingerprinting (идентификация модели по ответам)? ## Краткий тезис [[Вики/LLM fingerprinting\|LLM fingerprinting]] — это метод идентификации конкретной языковой…
- answerНазовите 4 уровня языкового представления по Yang et al. (2026) и объясните разницу?
…зачем нужны уровни языкового представления? Современные языковые модели ([[Вики/LLM\|LLM]]) работают преимущественно с [[Вики/natural language\|Natural Language]] (естественным…
- answerКак вы обеспечиваете, чтобы ответы LLM были консистентными для одинаковых вопросов?
…Как вы обеспечиваете, чтобы ответы LLM были консистентными для одинаковых вопросов? ## Краткий тезис [[Вики/consistency\|Консистентность]] ответов]] [[Вики/LLM\|LLM…
- answerКак вы оцениваете качество после fine-tuning?
…Незаменима для: - Критичных доменов (медицина, юриспруденция). - Оценки субъективных качеств ([[Вики/Helpfulness Harmlessness\|полезность]], креативность, тон). - Валидации [[Вики/LLM-as-a…
- answerКак работает softmax и почему он вызывает проблемы с градиентами при больших logits?
…меток; в генеративных моделях ([[Вики/GPT-4o\|LLM]]) [[Вики/Temperature\|temperature]] контролирует креативность. --- ## 6. Вычитание максимального logit (subtract max) Для…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Настроить prompt regression suite
…LLM\|Llama 3.2-1B-Instruct]]` через [[Вики/LLM\|Ollama]]). 2. Определите 3 версии системного промпта (базовая, с повышенной креативностью…
- answerКак вы измеряете объяснимость (explainability) агентских решений?
…Как вы оцениваете креативность LLM в production\|173]] | Какие методы интерпретируемости LLM вы знаете? | | [[174. Что такое «многошаговая когерентность» (coherence…
- answerКак детектировать «объяснительно-решенческую декомпозицию»?
…Как вы оцениваете креативность LLM в production\|173]] | Инструменты и вызовы | | [[174. Что такое «многошаговая когерентность» (coherence illusion) в cascading…
- answerЧто такое reward hacking в RLHF и как его детектировать?
…Что такое Positional bias в LLM-as-Judge и как его исправить\|493]] | Оценка качества alignment (human evaluation, benchmarks) | | [[494…
- indexИндекс разборов
…Как вы оцениваете креативность LLM в production\|173. Как вы оцениваете креативность LLM в production?]] - [[174. Что такое «многошаговая когерентность…
- indexОглавление
…Как вы оцениваете креативность LLM в production\|173. Как вы оцениваете креативность LLM в production?]] - [[Вопросы/Ответы/174. Что такое…
- indexПРАКТИЧЕСКИЙ ЧЕКЛИСТ: СТАFF+ AI SYSTEMS ENGINEERING
…теория) | | 171 | IRT | Pet 236 | | 172 | LiveIdeaBench | — (теория) | | 173 | Креативность LLM | — (теория) | | 174 | Coherence illusion | Q 153, D 122 | | 175…
- question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)
…Показал, что творческие способности LLM плохо коррелируют с общей intelligence . **173. Как вы оцениваете креативность LLM в production?** > *Ответ:* > - **Fluency…