Alpaca Dataset

Alpaca Dataset

Определение

Alpaca Dataset — это набор данных для instruction tuning, созданный Стэнфордом на основе модели Self-Instruct. Он содержит 52 тысячи примеров в формате (инструкция, контекст, ответ) и широко используется для fine-tuning языковых моделей. Формат Alpaca предполагает три поля: instruction, input (контекст), output (ответ). Этот датасет стал стандартом для обучения моделей следовать инструкциям.

Где встречается

Навигация