Поиск

wikiReasoning
…Сравнить архитектуры на reasoning задачах|59. Сравнить архитектуры на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
wikireasoning models
# reasoning models ## Определение Класс моделей, выполняющих многошаговые рассуждения с использованием test-time compute для улучшения качества ответов на сложные задачи…
wikicost of reasoning
# cost of reasoning ## Определение Совокупная стоимость выполнения агентом цепочки действий (шагов) для решения задачи, включая стоимость токенов, задержки и штрафы…
wikiLatent Reasoning
# Latent Reasoning ## Определение Метод рассуждения, при котором модель выполняет внутренние итерации в скрытом пространстве эмбеддингов, не генерируя видимых токенов, что…
wikiReasoning depth
…Как вы оцениваете reasoning capability (не просто recall) на длинном контексте|633. Как вы оцениваете reasoning capability (не просто recall…
wikiReasoning errors
…Как вы измеряете «cost of reasoning» у агента (не только токены, но и шаги, время, ошибки)|393. Как вы измеряете…
wikireasoning schema
# reasoning schema ## Определение Структура рассуждений, активируемая промптом, например, причинно-следственная или сбалансированная схема. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация…
wikilatent space reasoning
# latent space reasoning ## Определение Процесс рассуждения модели в скрытом пространстве без генерации промежуточных токенов; синоним Latent Reasoning. ## Где встречается - [[800…
wikireasoning degradation
# reasoning degradation ## Определение Падение качества рассуждений модели при увеличении длины контекста, измеряемое как снижение точности на длинных последовательностях. ## Где встречается…
answerКак вы оцениваете reasoning capability (не просто recall) на длинном контексте?
…спросить «Чему равно A?» (1 шаг). - Одношаговое [[Вики/Reasoning\|reasoning]]: «Чему равно B?» (2 факта). - Многошаговое [[Вики/Reasoning\|reasoning]]: «Чему…
wikiadaptive reasoning depth
# adaptive reasoning depth ## Определение Адаптивное управление глубиной рассуждения во время инференса, позволяющее модели использовать больше вычислительных ресурсов на сложных шагах…
wikimoral reasoning attack
# moral reasoning attack ## Определение Moral reasoning attack — тип jailbreak-атаки на LLM, использующий этический релятивизм и двойные стандарты для обхода…
wikiMulti-hop reasoning
# Multi-hop reasoning ## Определение Процесс, требующий нескольких шагов рассуждения и поиска для ответа на сложный вопрос. ## Где встречается - [[162. Что…
wikiMulti-step reasoning
# Multi-step reasoning ## Определение Процесс логических рассуждений, требующий нескольких последовательных шагов для получения ответа. Часто реализуется через агентов или цепочки…
answerВ чем разница между Chain-of-Thought (CoT) и Latent Reasoning?
…Latent Reasoning [[Вики/Latent Reasoning\|Latent Reasoning]] — подход, при котором [[Вики/model\|модель]] проводит внутренние итерации рассуждения в скрытом пространстве…
wikiCommonsenseQA
# CommonsenseQA ## Определение Набор данных для оценки способности моделей отвечать на вопросы, требующие здравого смысла (commonsense reasoning). ## Где встречается - [[59. Сравнить…
wikireasoning steps
# reasoning steps ## Определение Отдельные шаги в процессе рассуждения агента, каждый из которых имеет свою стоимость (токены, время, вызовы инструментов). ## Где…
wikinegative entropy
…Применяется в методах latent reasoning. ## Где встречается - [[67. Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] ## Навигация - [[00. Индекс…
wikiReasoning via Planning
# Reasoning via Planning ## Определение Метод, использующий MCTS (Monte Carlo Tree Search) для планирования цепочек мыслей в LLM-агентах. ## Где встречается…
wikicausal reasoning
# causal reasoning ## Определение Способность модели выявлять и использовать причинно-следственные связи. Может зависеть от языка промпта и используется для оценки…
wikilatent reasoning token
# latent reasoning token ## Определение Обучаемый вектор, вставляемый в последовательность скрытых состояний модели для выполнения латентного рассуждения. ## Где встречается - [[290. Что…
wikiDegradation slope
# Degradation slope ## Определение Наклон графика accuracy в зависимости от длины контекста; показывает скорость падения качества reasoning при увеличении контекста. ## Где…
wikiHallucination in reasoning
# Hallucination in reasoning ## Определение Ситуация, когда модель выдумывает причину, похожую на те, что встречались в обучающих данных, что снижает достоверность…
wikimath reasoning
# math reasoning ## Определение Задача генерации цепочек мыслей для решения математических задач. Часто служит полигоном для методов самообучения, таких как ReST…
wikiLong context reasoning
# Long context reasoning ## Определение Способность языковой модели выполнять рассуждения и извлекать выводы из большого объёма входного текста, что требует эффективной…
wikimulti-hop QA
…В чем разница между Chain-of-Thought (CoT) и Latent Reasoning|152. В чем разница между Chain-of-Thought (CoT…
wikiMulti-hop accuracy
…Как вы оцениваете reasoning capability (не просто recall) на длинном контексте|633. Как вы оцениваете reasoning capability (не просто recall…
wikicounterfactual reasoning
# counterfactual reasoning ## Определение Тип рассуждений «что, если?», где фактор меняется на противоположный. Используется для тестирования агентов и оценки их устойчивости…
wikiDistractors
# Distractors ## Определение Нерелевантные факты, добавляемые в контекст для усложнения задачи и проверки устойчивости reasoning модели. ## Где встречается - [[633. Как вы…
wikiQwen2.5-7B
…Сравнить GPTQ vs AWQ на reasoning задачах|210. Сравнить GPTQ vs AWQ на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс…
wikiL-Eval
# L-Eval ## Определение Бенчмарк для оценки способности LLM к рассуждению на длинных контекстах, включающий 18 задач multi-document reasoning. ## Где…
wikiMulti-needle
# Multi-needle ## Определение Усложнение теста «Needle in a Haystack» с несколькими связанными фактами для проверки multi-hop reasoning. ## Где встречается…
wikiMath
…Сравнить архитектуры на reasoning задачах|59. Сравнить архитектуры на reasoning задачах]] - [[65. Реализовать process reward model|65. Реализовать process reward…
wikiexllamav2
…Сравнить GPTQ vs AWQ на reasoning задачах|210. Сравнить GPTQ vs AWQ на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс…
answerЧто такое Chain-of-Thought без токенов (latent CoT) и как это реализовано?
…COCONUT (2025) — конкретная реализация [[Вики/Latent Reasoning\|COCONUT]] ([[Вики/Latent Reasoning\|Chain-of-Continuous-Thought]]) — метод, предложенный в 2025 году…
wikidetach
…Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
wikisupervised loss
…Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
wikiAutoAWQ
…Сравнить GPTQ vs AWQ на reasoning задачах|210. Сравнить GPTQ vs AWQ на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс…
wikiGPT-2 tokenizer
…Сравнить архитектуры на reasoning задачах|59. Сравнить архитектуры на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
wikiMemory-efficient inference
…Сравнить архитектуры на reasoning задачах|59. Сравнить архитектуры на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
wikinn.Parameter
…Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
wikiunsupervised loss
…Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…
wikiHELMET
…Как вы оцениваете reasoning capability (не просто recall) на длинном контексте|633. Как вы оцениваете reasoning capability (не просто recall…
wikiRecurrent vs parallel computation
…Сравнить архитектуры на reasoning задачах|59. Сравнить архитектуры на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
wikiBlocksworld
…В чем разница между Chain-of-Thought (CoT) и Latent Reasoning|152. В чем разница между Chain-of-Thought (CoT…
wikigradient step
…Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] - [[273. Реализовать curriculum learning|273. Реализовать curriculum learning]] ## Навигация - [[00. Индекс…
wikiRecurrent GPT
…В чем разница между Chain-of-Thought (CoT) и Latent Reasoning|152. В чем разница между Chain-of-Thought (CoT…
wikiauto-gptq
…Сравнить GPTQ vs AWQ на reasoning задачах|210. Сравнить GPTQ vs AWQ на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс…
wikideliberate decoding
# deliberate decoding ## Определение Technique in reasoning models where multiple rounds of planning are performed before generating the final output, improving…
wikiRULER
…Как вы оцениваете reasoning capability (не просто recall) на длинном контексте|633. Как вы оцениваете reasoning capability (не просто recall…