Chain-of-Thought
Chain-of-Thought
Определение
Метод промптинга, при котором модель генерирует промежуточные шаги рассуждения перед ответом. Улучшает качество на задачах, требующих логики, но увеличивает задержку и стоимость.
Где встречается
- 29. Как fine-tune модель для следования сложным инструкциям
- 34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
- 47. Что такое ReAct Agent и как он работает
- 53. Как вы проектируете промпт для агента с инструментами
- 80. Какие 3 книгикурса вы рекомендуете по production LLM
- 94. Как вы проектируете промпты, которые работают с разными моделями
- 101. Что такое DSPy и какую проблему он решает, которую не решают LangChain или LlamaIndex
- 102. Объясните концепцию «сигнатуры» (Signature) в DSPy. Чем она отличается от традиционного промпта
- 103. Какие оптимизаторы (teleprompters) в DSPy вы использовали и когда BootstrapFewShot, MIPRO, COPRO
- 104. Как вы интегрируете DSPy с RAG-пайплайном Приведите пример сигнатуры.
- 105. Когда DSPy не подходит Назовите 3 сценария.
- 108. Что такое Assertions в DSPy и зачем они нужны
- 129. Как вы обнаруживаете многошаговые jailbreak-атаки (через 10-20 сообщений)
- 132. Как вы калибруете LLM-судью под человеческие оценки
- 142. Как вы проектируете «планировщика» (planner) для Agentic RAG
- 144. Как вы передаете состояние (state) между шагами агента
- 151. Что такое тест-тайм компьютинг (Test-Time Compute) и чем он отличается от обычного инференса
- 153. Что такое ∇-Reasoner (nabla-reasoner) и как он использует градиентный спуск на этапе теста
- 156. Как вы выбираете между увеличением тест-тайм компьютинга и использованием большей модели
- 166. Назовите 7 production failure modes для agentic AI систем по PAEF (Pandey, 2026).
- 174. Что такое «многошаговая когерентность» (coherence illusion) в cascading agent systems
- 175. Как детектировать «объяснительно-решенческую декомпозицию»
- 181. В чем проблема «natural language bottleneck» для LLM
- 182. Что такое «схема» (schema) в контексте LLM и как она связана с языковым представлением
- 184. Почему естественный язык не подходит для сложного рассуждения
- 186. Что такое «shaping schema through language representation»
- 187. Как язык промпта (русский vs английский) влияет на схему рассуждения
- 188. Что такое «Schema-Activated In-Context Learning» (SA-ICL)
- 196. Как language representation связан с тест-тайм компьютингом
- 199. Как вы combine language representation с DSPy
- 289. Как работает speculative decoding на уровне логитов, а не токенов
- 328. GRPO (Group Relative Policy Optimization) vs PPO — чем отличается и зачем нужен
- 362. Что такое Fuyu-8B и чем архитектурно отличается от GPT-4V
- 377. Как вы делаете retrieval для структурированных данных (SQL, Knowledge Graph)
- 395. Как вы тестируете агента на «неожиданные input» (не только adversarial, но и просто странные)
- 399. Как вы делаете AB тест между двумя агентами с разными архитектурами (ReAct vs Plan-and-Execute)
- 442. Что такое prefix caching и когда он эффективен
- 466. Что такое curriculum learning для LLM и как его реализовать
- 579. Как работает agent replay для улучшения качества (анализ failed траекторий)
- 589. Как вы делаете agent с human values alignment (Constitutional AI для агентов)