tool selection learning
tool selection learning
Определение
Дообучение модели на размеченных примерах, чтобы она научилась выбирать правильный инструмент или решала, когда инструмент не нужен, предотвращая tool overuse.
Где встречается
- 573. Как вы предотвращаете tool overuse (когда агент вызывает API даже когда не нужно)
- 699. Как вы оцениваете, сколько синтетических данных нужно для fine-tuning (power analysis)
- 800+ вопросов