Aligned model

Aligned model

Определение

Aligned model (согласованная или выровненная модель) — это модель, прошедшая последовательные этапы обучения: базовое предобучение (base model), затем supervised fine-tuning (SFT) и, наконец, reinforcement learning from human feedback (RLHF). В результате такого пайплайна модель научается генерировать ответы, соответствующие предпочтениям человека, и по умолчанию выдаёт полезные, безопасные и релевантные ответы без дополнительных подсказок.

Где встречается

Навигация