tree search
tree search
Определение
Метод планирования и рассуждения, при котором LLM генерирует несколько вариантов и исследует их с backtracking, альтернатива линейным цепочкам действий (CoT).
Где встречается
- 142. Как вы проектируете «планировщика» (planner) для Agentic RAG
- 151. Что такое тест-тайм компьютинг (Test-Time Compute) и чем он отличается от обычного инференса
- 153. Что такое ∇-Reasoner (nabla-reasoner) и как он использует градиентный спуск на этапе теста
- 156. Как вы выбираете между увеличением тест-тайм компьютинга и использованием большей модели
- 345. Как вы проектируете red teaming evaluation для jailbreak устойчивости
- 456. Что такое Medusa (multiple heads) для speculative decoding
- 636. Как вы проектируете промпт для long context рассуждения (CoT, ToT, GoT)
- 637. Что такое Chain-of-Thought без токенов (latent CoT, COCONUT)
- 638. Как работает ∇-Reasoner (градиентный спуск в пространстве токенов на этапе теста)
- 893. Как работает tree search (MCTS) для LLM агентов
- Практика
- 800+ вопросов