Поиск
- wikiToolformer
…Как работает Toolformer (обучение агента использованию инструментов)|898. Как работает Toolformer (обучение агента использованию инструментов)]] - [[800+ вопросов|800+ вопросов]] ## Навигация…
- answerКак работает Toolformer (обучение агента использованию инструментов)?
…Как работает Toolformer (обучение агента использованию инструментов)? ## Краткий тезис [[Вики/Toolformer\|Toolformer]] — это метод, предложенный Meta AI, который обучает языковую…
- wikiPerplexity gain
…Как работает Toolformer (обучение агента использованию инструментов)|898. Как работает Toolformer (обучение агента использованию инструментов)]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiLoss masking
…Как работает Toolformer (обучение агента использованию инструментов)|898. Как работает Toolformer (обучение агента использованию инструментов)]] ## Навигация - [[00. Индекс терминов|Индекс…
- answerКак работает Toolformer-like обучение для агентов (self-supervised tool use)?
…Как работает Toolformer-like обучение для агентов (self-supervised tool use)? ## Краткий тезис [[Вики/Toolformer\|Toolformer]] — это подход от Meta…
- wikinext token prediction
…Как работает Toolformer (обучение агента использованию инструментов)|898. Как работает Toolformer (обучение агента использованию инструментов)]] - [[800+ вопросов|800+ вопросов]] ## Навигация…
- wikiself-supervision
…Как работает Toolformer (обучение агента использованию инструментов)|898. Как работает Toolformer (обучение агента использованию инструментов)]] - [[Практика|Практика]] - [[800+ вопросов|800…
- wikiAPI tokens
…Применяются при обучении моделей использованию инструментов, например, в подходе Toolformer. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс терминов…
- wikiself-supervised tool use
…при котором модель сама генерирует примеры вызова API (аналог Toolformer). ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс терминов…
- wikiaction
…Как работает Toolformer (обучение агента использованию инструментов)|898. Как работает Toolformer (обучение агента использованию инструментов)]] - [[Практика|Практика]] - [[800+ вопросов|800…
- wikiplanning
…Как работает Toolformer (обучение агента использованию инструментов)|898. Как работает Toolformer (обучение агента использованию инструментов)]] - [[800+ вопросов|800+ вопросов]] ## Навигация…
- wikiSFT
…Как работает Toolformer (обучение агента использованию инструментов)|898. Как работает Toolformer (обучение агента использованию инструментов)]] - [[899. Что такое DSPy в…
- wikicross-entropy loss
…Как работает Toolformer (обучение агента использованию инструментов)|898. Как работает Toolformer (обучение агента использованию инструментов)]] - [[800+ вопросов|800+ вопросов]] - [[48…
- answerЧто такое reflection loops для агентов и как они работают?
…Как работает Toolformer-like обучение для агентов (self-supervised tool use)\|568]] | Память агентов (memory) | | [[570. Что такое tree search…
- answerЧто такое logits и как они связаны с вероятностями? temperature scaling?
…Роль temperature в Agentic RAG В архитектурах [[Вики/Agentic RAG\|Agentic RAG]] (например, [[Вики/ReAct Agent\|ReAct]], [[Вики/Toolformer\|Toolformer…
- answerЧто такое planner/executor architecture для агентов и когда она нужна?
…Как работает Toolformer-like обучение для агентов (self-supervised tool use)\|568]] | Что такое ReAct паттерн и чем отличается от…
- answerЧто такое Recurrent Depth в контексте LLM и зачем это нужно?
…В чем разница между Chain-of-Thought (CoT) и Latent Reasoning\|152]] | Какие архитектуры агентов существуют (ReAct, Toolformer, etc.)? | | [[153…
- answerЧто такое tree search agents (MCTS for LLM) и когда они эффективны?
…Как работает Toolformer-like обучение для агентов (self-supervised tool use)\|568]] | Planning в агентах | MCTS — это один из методов…
- answerЧто такое DSPy в контексте агентов?
…Как работает Toolformer (обучение агента использованию инструментов)\|898]] - Следующий: [[900. Как работают browser agents и computer use agents (Claude Computer…
- answerКак вы делаете image retrieval с фильтрацией по метаданным (дата, местоположение, камера)?
…Как работает Toolformer-like обучение для агентов (self-supervised tool use)\|568]] | Обработка метаданных в RAG-пайплайне | --- ## Навигация (Obsidian) - Предыдущий…
- answerКак работают agent swarms (рой агентов)?
…Как работает Toolformer (обучение агента использованию инструментов)\|898]] - Индекс: [[00. Индекс разборов]]
- indexИндекс разборов
…Как работает Toolformer-like обучение для агентов (self-supervised tool use)\|568. Как работает Toolformer-like обучение для агентов (self…
- indexОглавление
…Как работает Toolformer-like обучение для агентов (self-supervised tool use)\|568. Как работает Toolformer-like обучение для агентов (self…
- indexПРАКТИЧЕСКИЙ ЧЕКЛИСТ: СТАFF+ AI SYSTEMS ENGINEERING
…897 | Agent swarms | D 125, I 176-190 | | 898 | Toolformer | H 106, Pet 235 | | 899 | DSPy для агентов | Pet 230…
- question_bankЧАСТЬ 1: RAG-СИСТЕМЫ (20 вопросов)
…Как работает Toolformer-like обучение для агентов (self-supervised tool use)?** > _Ответ:_ Toolformer (Meta) — обучение агента использованию API через самоконтроль…
- wikiИндекс терминов
…attack]] - [[Вики/tool_call_failure|tool_call_failure]] - [[Вики/Toolformer|Toolformer]] - [[Вики/ToolValidationError|ToolValidationError]] - [[Вики/Top-1 selection|Top-1…