Поиск
- wikiReasoning
…Сравнить архитектуры на reasoning задачах|59. Сравнить архитектуры на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikireasoning models
# reasoning models ## Определение Класс моделей, выполняющих многошаговые рассуждения с использованием test-time compute для улучшения качества ответов на сложные задачи…
- wikicost of reasoning
# cost of reasoning ## Определение Совокупная стоимость выполнения агентом цепочки действий (шагов) для решения задачи, включая стоимость токенов, задержки и штрафы…
- wikiLatent Reasoning
# Latent Reasoning ## Определение Метод рассуждения, при котором модель выполняет внутренние итерации в скрытом пространстве эмбеддингов, не генерируя видимых токенов, что…
- wikiReasoning depth
…Как вы оцениваете reasoning capability (не просто recall) на длинном контексте|633. Как вы оцениваете reasoning capability (не просто recall…
- wikiReasoning errors
…Как вы измеряете «cost of reasoning» у агента (не только токены, но и шаги, время, ошибки)|393. Как вы измеряете…
- wikireasoning schema
# reasoning schema ## Определение Структура рассуждений, активируемая промптом, например, причинно-следственная или сбалансированная схема. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация…
- wikilatent space reasoning
# latent space reasoning ## Определение Процесс рассуждения модели в скрытом пространстве без генерации промежуточных токенов; синоним Latent Reasoning. ## Где встречается - [[800…
- wikireasoning degradation
# reasoning degradation ## Определение Падение качества рассуждений модели при увеличении длины контекста, измеряемое как снижение точности на длинных последовательностях. ## Где встречается…
- answerКак вы оцениваете reasoning capability (не просто recall) на длинном контексте?
…спросить «Чему равно A?» (1 шаг). - Одношаговое [[Вики/Reasoning\|reasoning]]: «Чему равно B?» (2 факта). - Многошаговое [[Вики/Reasoning\|reasoning]]: «Чему…
- wikiadaptive reasoning depth
# adaptive reasoning depth ## Определение Адаптивное управление глубиной рассуждения во время инференса, позволяющее модели использовать больше вычислительных ресурсов на сложных шагах…
- wikimoral reasoning attack
# moral reasoning attack ## Определение Moral reasoning attack — тип jailbreak-атаки на LLM, использующий этический релятивизм и двойные стандарты для обхода…
- wikiMulti-hop reasoning
# Multi-hop reasoning ## Определение Процесс, требующий нескольких шагов рассуждения и поиска для ответа на сложный вопрос. ## Где встречается - [[162. Что…
- wikiMulti-step reasoning
# Multi-step reasoning ## Определение Процесс логических рассуждений, требующий нескольких последовательных шагов для получения ответа. Часто реализуется через агентов или цепочки…
- answerВ чем разница между Chain-of-Thought (CoT) и Latent Reasoning?
…Latent Reasoning [[Вики/Latent Reasoning\|Latent Reasoning]] — подход, при котором [[Вики/model\|модель]] проводит внутренние итерации рассуждения в скрытом пространстве…
- wikiCommonsenseQA
# CommonsenseQA ## Определение Набор данных для оценки способности моделей отвечать на вопросы, требующие здравого смысла (commonsense reasoning). ## Где встречается - [[59. Сравнить…
- wikireasoning steps
# reasoning steps ## Определение Отдельные шаги в процессе рассуждения агента, каждый из которых имеет свою стоимость (токены, время, вызовы инструментов). ## Где…
- wikinegative entropy
…Применяется в методах latent reasoning. ## Где встречается - [[67. Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] ## Навигация - [[00. Индекс…
- wikiReasoning via Planning
# Reasoning via Planning ## Определение Метод, использующий MCTS (Monte Carlo Tree Search) для планирования цепочек мыслей в LLM-агентах. ## Где встречается…
- wikicausal reasoning
# causal reasoning ## Определение Способность модели выявлять и использовать причинно-следственные связи. Может зависеть от языка промпта и используется для оценки…
- wikilatent reasoning token
# latent reasoning token ## Определение Обучаемый вектор, вставляемый в последовательность скрытых состояний модели для выполнения латентного рассуждения. ## Где встречается - [[290. Что…
- wikiDegradation slope
# Degradation slope ## Определение Наклон графика accuracy в зависимости от длины контекста; показывает скорость падения качества reasoning при увеличении контекста. ## Где…
- wikiHallucination in reasoning
# Hallucination in reasoning ## Определение Ситуация, когда модель выдумывает причину, похожую на те, что встречались в обучающих данных, что снижает достоверность…
- wikimath reasoning
# math reasoning ## Определение Задача генерации цепочек мыслей для решения математических задач. Часто служит полигоном для методов самообучения, таких как ReST…
- wikiLong context reasoning
# Long context reasoning ## Определение Способность языковой модели выполнять рассуждения и извлекать выводы из большого объёма входного текста, что требует эффективной…
- wikimulti-hop QA
…В чем разница между Chain-of-Thought (CoT) и Latent Reasoning|152. В чем разница между Chain-of-Thought (CoT…
- wikiMulti-hop accuracy
…Как вы оцениваете reasoning capability (не просто recall) на длинном контексте|633. Как вы оцениваете reasoning capability (не просто recall…
- wikicounterfactual reasoning
# counterfactual reasoning ## Определение Тип рассуждений «что, если?», где фактор меняется на противоположный. Используется для тестирования агентов и оценки их устойчивости…
- wikiDistractors
# Distractors ## Определение Нерелевантные факты, добавляемые в контекст для усложнения задачи и проверки устойчивости reasoning модели. ## Где встречается - [[633. Как вы…
- wikiQwen2.5-7B
…Сравнить GPTQ vs AWQ на reasoning задачах|210. Сравнить GPTQ vs AWQ на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiL-Eval
# L-Eval ## Определение Бенчмарк для оценки способности LLM к рассуждению на длинных контекстах, включающий 18 задач multi-document reasoning. ## Где…
- wikiMulti-needle
# Multi-needle ## Определение Усложнение теста «Needle in a Haystack» с несколькими связанными фактами для проверки multi-hop reasoning. ## Где встречается…
- wikiMath
…Сравнить архитектуры на reasoning задачах|59. Сравнить архитектуры на reasoning задачах]] - [[65. Реализовать process reward model|65. Реализовать process reward…
- wikiexllamav2
…Сравнить GPTQ vs AWQ на reasoning задачах|210. Сравнить GPTQ vs AWQ на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс…
- answerЧто такое Chain-of-Thought без токенов (latent CoT) и как это реализовано?
…COCONUT (2025) — конкретная реализация [[Вики/Latent Reasoning\|COCONUT]] ([[Вики/Latent Reasoning\|Chain-of-Continuous-Thought]]) — метод, предложенный в 2025 году…
- wikidetach
…Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikisupervised loss
…Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikiAutoAWQ
…Сравнить GPTQ vs AWQ на reasoning задачах|210. Сравнить GPTQ vs AWQ на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiGPT-2 tokenizer
…Сравнить архитектуры на reasoning задачах|59. Сравнить архитектуры на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiMemory-efficient inference
…Сравнить архитектуры на reasoning задачах|59. Сравнить архитектуры на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikinn.Parameter
…Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikiunsupervised loss
…Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
- wikiHELMET
…Как вы оцениваете reasoning capability (не просто recall) на длинном контексте|633. Как вы оцениваете reasoning capability (не просто recall…
- wikiRecurrent vs parallel computation
…Сравнить архитектуры на reasoning задачах|59. Сравнить архитектуры на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiBlocksworld
…В чем разница между Chain-of-Thought (CoT) и Latent Reasoning|152. В чем разница между Chain-of-Thought (CoT…
- wikigradient step
…Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] - [[273. Реализовать curriculum learning|273. Реализовать curriculum learning]] ## Навигация - [[00. Индекс…
- wikiRecurrent GPT
…В чем разница между Chain-of-Thought (CoT) и Latent Reasoning|152. В чем разница между Chain-of-Thought (CoT…
- wikiauto-gptq
…Сравнить GPTQ vs AWQ на reasoning задачах|210. Сравнить GPTQ vs AWQ на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikideliberate decoding
# deliberate decoding ## Определение Technique in reasoning models where multiple rounds of planning are performed before generating the final output, improving…
- wikiRULER
…Как вы оцениваете reasoning capability (не просто recall) на длинном контексте|633. Как вы оцениваете reasoning capability (не просто recall…