OpenAssistant Conversations

OpenAssistant Conversations

Определение

OpenAssistant Conversations (oasst1) — это крупномасштабный датасет диалогов, собранный с участием людей для обучения моделей-ассистентов с открытым исходным кодом. Он содержит пары «промпт + хороший ответ», а также оценки качества ответов. Используется для fine-tuning на инструкции и обучения с подкреплением на основе человеческой обратной связи (RLHF).

Где встречается

Навигация