中文翻译暂不可用,显示俄语原文。
ShareGPT / OpenAssistant / Dolly
ShareGPT / OpenAssistant / Dolly
Определение
Открытые датасеты диалогов и инструкций, используемые для fine-tuning и оценки моделей (например, instruction tuning и RLHF).
Где встречается
- 29. Как fine-tune модель для следования сложным инструкциям
- 32. Как вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами
- 129. Как вы обнаруживаете многошаговые jailbreak-атаки (через 10-20 сообщений)
- 138. Что такое «оценка с подкреплением» (RLHF evaluation) и как она отличается от обычной