…

中文翻译暂不可用，显示俄语原文。

ShareGPT / OpenAssistant / Dolly

ShareGPT / OpenAssistant / Dolly

Определение

Открытые датасеты диалогов и инструкций, используемые для fine-tuning и оценки моделей (например, instruction tuning и RLHF).

Где встречается

29. Как fine-tune модель для следования сложным инструкциям
32. Как вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами
129. Как вы обнаруживаете многошаговые jailbreak-атаки (через 10-20 сообщений)
138. Что такое «оценка с подкреплением» (RLHF evaluation) и как она отличается от обычной

Навигация