Поиск

  • wikiReasoning

    …Сравнить архитектуры на reasoning задачах|59. Сравнить архитектуры на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikireasoning models

    # reasoning models ## Определение Класс моделей, выполняющих многошаговые рассуждения с использованием test-time compute для улучшения качества ответов на сложные задачи…

  • wikicost of reasoning

    # cost of reasoning ## Определение Совокупная стоимость выполнения агентом цепочки действий (шагов) для решения задачи, включая стоимость токенов, задержки и штрафы…

  • wikiLatent Reasoning

    # Latent Reasoning ## Определение Метод рассуждения, при котором модель выполняет внутренние итерации в скрытом пространстве эмбеддингов, не генерируя видимых токенов, что…

  • wikiReasoning depth

    …Как вы оцениваете reasoning capability (не просто recall) на длинном контексте|633. Как вы оцениваете reasoning capability (не просто recall…

  • wikiReasoning errors

    …Как вы измеряете «cost of reasoning» у агента (не только токены, но и шаги, время, ошибки)|393. Как вы измеряете…

  • wikireasoning schema

    # reasoning schema ## Определение Структура рассуждений, активируемая промптом, например, причинно-следственная или сбалансированная схема. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация…

  • wikilatent space reasoning

    # latent space reasoning ## Определение Процесс рассуждения модели в скрытом пространстве без генерации промежуточных токенов; синоним Latent Reasoning. ## Где встречается - [[800…

  • wikireasoning degradation

    # reasoning degradation ## Определение Падение качества рассуждений модели при увеличении длины контекста, измеряемое как снижение точности на длинных последовательностях. ## Где встречается…

  • answerКак вы оцениваете reasoning capability (не просто recall) на длинном контексте?

    …спросить «Чему равно A?» (1 шаг). - Одношаговое [[Вики/Reasoning\|reasoning]]: «Чему равно B?» (2 факта). - Многошаговое [[Вики/Reasoning\|reasoning]]: «Чему…

  • wikiadaptive reasoning depth

    # adaptive reasoning depth ## Определение Адаптивное управление глубиной рассуждения во время инференса, позволяющее модели использовать больше вычислительных ресурсов на сложных шагах…

  • wikimoral reasoning attack

    # moral reasoning attack ## Определение Moral reasoning attack — тип jailbreak-атаки на LLM, использующий этический релятивизм и двойные стандарты для обхода…

  • wikiMulti-hop reasoning

    # Multi-hop reasoning ## Определение Процесс, требующий нескольких шагов рассуждения и поиска для ответа на сложный вопрос. ## Где встречается - [[162. Что…

  • wikiMulti-step reasoning

    # Multi-step reasoning ## Определение Процесс логических рассуждений, требующий нескольких последовательных шагов для получения ответа. Часто реализуется через агентов или цепочки…

  • answerВ чем разница между Chain-of-Thought (CoT) и Latent Reasoning?

    …Latent Reasoning [[Вики/Latent Reasoning\|Latent Reasoning]] — подход, при котором [[Вики/model\|модель]] проводит внутренние итерации рассуждения в скрытом пространстве…

  • wikiCommonsenseQA

    # CommonsenseQA ## Определение Набор данных для оценки способности моделей отвечать на вопросы, требующие здравого смысла (commonsense reasoning). ## Где встречается - [[59. Сравнить…

  • wikireasoning steps

    # reasoning steps ## Определение Отдельные шаги в процессе рассуждения агента, каждый из которых имеет свою стоимость (токены, время, вызовы инструментов). ## Где…

  • wikinegative entropy

    …Применяется в методах latent reasoning. ## Где встречается - [[67. Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] ## Навигация - [[00. Индекс…

  • wikiReasoning via Planning

    # Reasoning via Planning ## Определение Метод, использующий MCTS (Monte Carlo Tree Search) для планирования цепочек мыслей в LLM-агентах. ## Где встречается…

  • wikicausal reasoning

    # causal reasoning ## Определение Способность модели выявлять и использовать причинно-следственные связи. Может зависеть от языка промпта и используется для оценки…

  • wikilatent reasoning token

    # latent reasoning token ## Определение Обучаемый вектор, вставляемый в последовательность скрытых состояний модели для выполнения латентного рассуждения. ## Где встречается - [[290. Что…

  • wikiDegradation slope

    # Degradation slope ## Определение Наклон графика accuracy в зависимости от длины контекста; показывает скорость падения качества reasoning при увеличении контекста. ## Где…

  • wikiHallucination in reasoning

    # Hallucination in reasoning ## Определение Ситуация, когда модель выдумывает причину, похожую на те, что встречались в обучающих данных, что снижает достоверность…

  • wikimath reasoning

    # math reasoning ## Определение Задача генерации цепочек мыслей для решения математических задач. Часто служит полигоном для методов самообучения, таких как ReST…

  • wikiLong context reasoning

    # Long context reasoning ## Определение Способность языковой модели выполнять рассуждения и извлекать выводы из большого объёма входного текста, что требует эффективной…

  • wikimulti-hop QA

    …В чем разница между Chain-of-Thought (CoT) и Latent Reasoning|152. В чем разница между Chain-of-Thought (CoT…

  • wikiMulti-hop accuracy

    …Как вы оцениваете reasoning capability (не просто recall) на длинном контексте|633. Как вы оцениваете reasoning capability (не просто recall…

  • wikicounterfactual reasoning

    # counterfactual reasoning ## Определение Тип рассуждений «что, если?», где фактор меняется на противоположный. Используется для тестирования агентов и оценки их устойчивости…

  • wikiDistractors

    # Distractors ## Определение Нерелевантные факты, добавляемые в контекст для усложнения задачи и проверки устойчивости reasoning модели. ## Где встречается - [[633. Как вы…

  • wikiQwen2.5-7B

    …Сравнить GPTQ vs AWQ на reasoning задачах|210. Сравнить GPTQ vs AWQ на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiL-Eval

    # L-Eval ## Определение Бенчмарк для оценки способности LLM к рассуждению на длинных контекстах, включающий 18 задач multi-document reasoning. ## Где…

  • wikiMulti-needle

    # Multi-needle ## Определение Усложнение теста «Needle in a Haystack» с несколькими связанными фактами для проверки multi-hop reasoning. ## Где встречается…

  • wikiMath

    …Сравнить архитектуры на reasoning задачах|59. Сравнить архитектуры на reasoning задачах]] - [[65. Реализовать process reward model|65. Реализовать process reward…

  • wikiexllamav2

    …Сравнить GPTQ vs AWQ на reasoning задачах|210. Сравнить GPTQ vs AWQ на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс…

  • answerЧто такое Chain-of-Thought без токенов (latent CoT) и как это реализовано?

    …COCONUT (2025) — конкретная реализация [[Вики/Latent Reasoning\|COCONUT]] ([[Вики/Latent Reasoning\|Chain-of-Continuous-Thought]]) — метод, предложенный в 2025 году…

  • wikidetach

    …Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • wikisupervised loss

    …Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • wikiAutoAWQ

    …Сравнить GPTQ vs AWQ на reasoning задачах|210. Сравнить GPTQ vs AWQ на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiGPT-2 tokenizer

    …Сравнить архитектуры на reasoning задачах|59. Сравнить архитектуры на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiMemory-efficient inference

    …Сравнить архитектуры на reasoning задачах|59. Сравнить архитектуры на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikinn.Parameter

    …Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • wikiunsupervised loss

    …Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов|Индекс разборов…

  • wikiHELMET

    …Как вы оцениваете reasoning capability (не просто recall) на длинном контексте|633. Как вы оцениваете reasoning capability (не просто recall…

  • wikiRecurrent vs parallel computation

    …Сравнить архитектуры на reasoning задачах|59. Сравнить архитектуры на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiBlocksworld

    …В чем разница между Chain-of-Thought (CoT) и Latent Reasoning|152. В чем разница между Chain-of-Thought (CoT…

  • wikigradient step

    …Реализовать latent reasoning (∇-Reasoner)|67. Реализовать latent reasoning (∇-Reasoner)]] - [[273. Реализовать curriculum learning|273. Реализовать curriculum learning]] ## Навигация - [[00. Индекс…

  • wikiRecurrent GPT

    …В чем разница между Chain-of-Thought (CoT) и Latent Reasoning|152. В чем разница между Chain-of-Thought (CoT…

  • wikiauto-gptq

    …Сравнить GPTQ vs AWQ на reasoning задачах|210. Сравнить GPTQ vs AWQ на reasoning задачах]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikideliberate decoding

    # deliberate decoding ## Определение Technique in reasoning models where multiple rounds of planning are performed before generating the final output, improving…

  • wikiRULER

    …Как вы оцениваете reasoning capability (не просто recall) на длинном контексте|633. Как вы оцениваете reasoning capability (не просто recall…