ReAct Agent
ReAct Agent
Определение
Паттерн агента, объединяющий рассуждение (Reason) и действие (Act) в цикле: мысль → действие → наблюдение. Позволяет итеративно планировать и выполнять шаги, используя внешние инструменты для достижения цели.
Где встречается
- 38. Как вы fine-tune модель для функции вызов внешнего API
- 41. LangChain vs LlamaIndex vs Haystack — что выберете и почему
- 43. Как спроектировать агента, который может выполнять цепочку из 5-10 действий
- 47. Что такое ReAct Agent и как он работает
- 49. Как вы дебажите агента, который делает неправильные действия
- 54. Что такое Semantic Kernel и чем отличается от LangChain
- 80. Какие 3 книгикурса вы рекомендуете по production LLM
- 101. Что такое DSPy и какую проблему он решает, которую не решают LangChain или LlamaIndex
- 103. Какие оптимизаторы (teleprompters) в DSPy вы использовали и когда BootstrapFewShot, MIPRO, COPRO
- 104. Как вы интегрируете DSPy с RAG-пайплайном Приведите пример сигнатуры.
- 108. Что такое Assertions в DSPy и зачем они нужны
- 141. В чем разница между Naive RAG, Adaptive RAG и Agentic RAG
- 142. Как вы проектируете «планировщика» (planner) для Agentic RAG
- 149. Как спроектировать агента, который может самоисправляться (self-correction)
- 152. В чем разница между Chain-of-Thought (CoT) и Latent Reasoning
- 170. Что такое GIM (Grounded Integration Measure) и чем он отличается от GPQA
- 184. Почему естественный язык не подходит для сложного рассуждения
- 185. Как код как язык представления улучшает рассуждение LLM
- 199. Как вы combine language representation с DSPy
- 395. Как вы тестируете агента на «неожиданные input» (не только adversarial, но и просто странные)
- 399. Как вы делаете AB тест между двумя агентами с разными архитектурами (ReAct vs Plan-and-Execute)
- 446. Что такое chunked prefill и зачем он нужен
- 456. Что такое Medusa (multiple heads) для speculative decoding
- 475. Почему tokenizer влияет на стоимость training
- 567. Что такое plannerexecutor architecture для агентов и когда она нужна
- 570. Что такое tree search agents (MCTS for LLM) и когда они эффективны
- 575. Как работает hierarchical planning для агентов (разбивка на подзадачи)
- 578. Что такое agent evaluation метрика successful task completion rate vs step efficiency
- 580. Как вы делаем agent with theory of mind (понимание намерений пользователя)
- 584. Что такое agent distillation (обучение маленького агента на траекториях большого)
- 637. Что такое Chain-of-Thought без токенов (latent CoT, COCONUT)
- 646. Как работает attention с линейной сложностью (Linformer, Performer, Longformer)
- 662. Что такое logits и как они связаны с вероятностями temperature scaling
- 699. Как вы оцениваете, сколько синтетических данных нужно для fine-tuning (power analysis)
- 738. Назовите 12+ слоёв эталонной архитектуры Harness.
- 741. Что такое Partial Harnessing (частичное управление)
- 742. В чем разница между Workflow и Guidance в теории harness-engineering
- 752. Как Harness Engineering помогает решить проблему гарантий исполнения в критических миссиях (mission-critical)
- 753. Что такое Coordination Engineering и чем он отличается от Harness Engineering
- 754. Как Harness Engineering связан с наблюдаемостью (OpenTelemetry, LangSmith, трассировка)