rule-based reward modelrule-based reward model Определение Модель награды, основанная на заданных правилах, а не на обучении; применяется, например, для оценки безопасности ответов GPT-4. Где встречается 360. Что такое adversarial fine-tuning для защиты от jailbreak Навигация Индекс терминов Индекс разборов Оглавление
rule-based reward model Определение Модель награды, основанная на заданных правилах, а не на обучении; применяется, например, для оценки безопасности ответов GPT-4. Где встречается 360. Что такое adversarial fine-tuning для защиты от jailbreak Навигация Индекс терминов Индекс разборов Оглавление