Chain-of-Thought

Определение

Метод промптинга, при котором модель генерирует промежуточные шаги рассуждения перед ответом. Улучшает качество на задачах, требующих логики, но увеличивает задержку и стоимость.

Где встречается

29. Как fine-tune модель для следования сложным инструкциям
34. Какая у вас была самая сложная проблема при fine-tuning и как вы её решили
47. Что такое ReAct Agent и как он работает
53. Как вы проектируете промпт для агента с инструментами
80. Какие 3 книгикурса вы рекомендуете по production LLM
94. Как вы проектируете промпты, которые работают с разными моделями
101. Что такое DSPy и какую проблему он решает, которую не решают LangChain или LlamaIndex
102. Объясните концепцию «сигнатуры» (Signature) в DSPy. Чем она отличается от традиционного промпта
103. Какие оптимизаторы (teleprompters) в DSPy вы использовали и когда BootstrapFewShot, MIPRO, COPRO
104. Как вы интегрируете DSPy с RAG-пайплайном Приведите пример сигнатуры.
105. Когда DSPy не подходит Назовите 3 сценария.
108. Что такое Assertions в DSPy и зачем они нужны
129. Как вы обнаруживаете многошаговые jailbreak-атаки (через 10-20 сообщений)
132. Как вы калибруете LLM-судью под человеческие оценки
142. Как вы проектируете «планировщика» (planner) для Agentic RAG
144. Как вы передаете состояние (state) между шагами агента
151. Что такое тест-тайм компьютинг (Test-Time Compute) и чем он отличается от обычного инференса
153. Что такое ∇-Reasoner (nabla-reasoner) и как он использует градиентный спуск на этапе теста
156. Как вы выбираете между увеличением тест-тайм компьютинга и использованием большей модели
166. Назовите 7 production failure modes для agentic AI систем по PAEF (Pandey, 2026).
174. Что такое «многошаговая когерентность» (coherence illusion) в cascading agent systems
175. Как детектировать «объяснительно-решенческую декомпозицию»
181. В чем проблема «natural language bottleneck» для LLM
182. Что такое «схема» (schema) в контексте LLM и как она связана с языковым представлением
184. Почему естественный язык не подходит для сложного рассуждения
186. Что такое «shaping schema through language representation»
187. Как язык промпта (русский vs английский) влияет на схему рассуждения
188. Что такое «Schema-Activated In-Context Learning» (SA-ICL)
196. Как language representation связан с тест-тайм компьютингом
199. Как вы combine language representation с DSPy
289. Как работает speculative decoding на уровне логитов, а не токенов
328. GRPO (Group Relative Policy Optimization) vs PPO — чем отличается и зачем нужен
362. Что такое Fuyu-8B и чем архитектурно отличается от GPT-4V
377. Как вы делаете retrieval для структурированных данных (SQL, Knowledge Graph)
395. Как вы тестируете агента на «неожиданные input» (не только adversarial, но и просто странные)
399. Как вы делаете AB тест между двумя агентами с разными архитектурами (ReAct vs Plan-and-Execute)
442. Что такое prefix caching и когда он эффективен
466. Что такое curriculum learning для LLM и как его реализовать
579. Как работает agent replay для улучшения качества (анализ failed траекторий)
589. Как вы делаете agent с human values alignment (Constitutional AI для агентов)

Chain-of-Thought

Chain-of-Thought

Определение

Где встречается

Навигация

Chain-of-Thought

Chain-of-Thought

Определение

Где встречается

Навигация