Поиск
- wikiInstruction tuning
# Instruction tuning ## Определение Процесс дообучения LLM на наборе инструкций и ответов для улучшения следования инструкциям. ## Где встречается - [[29. Как fine…
- wikiEvol-Instruct
…Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[514. Как вы…
- wikiAxolotl
…Как вы генерируете synthetic данные для instruction tuning|514. Как вы генерируете synthetic данные для instruction tuning]] - [[681. Как вы…
- wikiSelf-instruct
…Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[514. Как вы…
- wikiReverse Instruction
…Как вы генерируете synthetic данные для instruction tuning|514. Как вы генерируете synthetic данные для instruction tuning]] ## Навигация - [[00. Индекс…
- wikiInstruction Formatting
# Instruction Formatting ## Определение Преобразование диалогов в формат инструкция-ответ для fine-tuning. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00…
- wikiLIMA
# LIMA ## Определение Подход к instruction tuning с минимальным количеством (около 1000) тщательно отобранных синтетических пар. ## Где встречается - [[259. Как вы…
- wikiRandom injection
# Random injection ## Определение Оператор аугментации данных, вставляющий случайный токен в текст для улучшения instruction tuning. ## Где встречается - [[267. Реализовать Evol…
- wikiFlan-T5-small
# Flan-T5-small ## Определение Модель google/flan-t5-small, используемая для демонстрации instruction tuning. ## Где встречается - [[267. Реализовать Evol-Instruct…
- wikiDistilabel
# Distilabel ## Определение Библиотека для синтеза данных с поддержкой методов Self-Instruct, Evol-Instruct и фильтрации, используемая для instruction tuning. ## Где…
- wikiseed examples
…Как вы генерируете synthetic данные для instruction tuning|514. Как вы генерируете synthetic данные для instruction tuning]] - [[681. Как вы…
- wikiUnnatural Instructions
…Как вы генерируете синтетический датасет для instruction tuning Self-instruct, Evol-Instruct|681. Как вы генерируете синтетический датасет для instruction…
- wikiAlpaca-LoRA
…Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] ## Навигация - [[00. Индекс…
- wikiMagpie
…Используется для instruction tuning. ## Где встречается - [[514. Как вы генерируете synthetic данные для instruction tuning|514. Как вы генерируете synthetic…
- wikiSelf-QA
# Self-QA ## Определение Метод генерации вопрос-ответных пар на основе документов для instruction tuning ретривер-агента в RAG. ## Где встречается…
- wikiChain-of-Thought generation
…Применяется при создании синтетических данных для instruction tuning. ## Где встречается - [[259. Как вы генерируете synthetic данные для instruction tuning|259…
- wikiinstruction format
# instruction format ## Определение Формат данных для fine-tuning (система + пользователь + ассистент), критичен для консистентности обучения. Использует шаблоны вроде <|user|>...<|assistant…
- wikiPhi-3-mini
…Реализовать Evol-Instruct для instruction tuning|267. Реализовать Evol-Instruct для instruction tuning]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiLLaMA-Factory
…Какие фреймворки для fine-tuning вы используете]] - [[681. Как вы генерируете синтетический датасет для instruction tuning Self-instruct, Evol-Instruct…
- wikiInstructLab
…Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] ## Навигация - [[00. Индекс…
- wikiBacktranslation
…Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] ## Навигация - [[00. Индекс…
- wikiSeed pool
…Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] ## Навигация - [[00. Индекс…
- wikiData augmentation
…Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[261. Как вы…
- wikiZero-shot generalization
…Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] ## Навигация - [[00. Индекс…
- wikiPairwise cosine distance
…Реализовать Evol-Instruct для instruction tuning|267. Реализовать Evol-Instruct для instruction tuning]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiRule-based filtering
…Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] ## Навигация - [[00. Индекс…
- wikiSemantic distance
…Реализовать Evol-Instruct для instruction tuning|267. Реализовать Evol-Instruct для instruction tuning]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- answerКак вы генерируете synthetic данные для instruction tuning?
…В контексте [[Вики/Instruction tuning\|instruction tuning]] ([[Вики/SFT\|дообучение]] [[Вики/LLM\|LLM]] на наборе инструкций и ожидаемых ответов) [[Вики…
- wikiN-gram novelty
…Реализовать Evol-Instruct для instruction tuning|267. Реализовать Evol-Instruct для instruction tuning]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiSFTTrainer
…Как вы генерируете синтетический датасет для instruction tuning Self-instruct, Evol-Instruct|681. Как вы генерируете синтетический датасет для instruction…
- wikiFiltering
…Как вы генерируете synthetic данные для instruction tuning|514. Как вы генерируете synthetic данные для instruction tuning]] ## Навигация - [[00. Индекс…
- wikiArgilla
…Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[333. Что такое…
- wikiJaccard similarity
…Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[800+ вопросов|800…
- answerКак вы генерируете синтетический датасет для instruction tuning? Self-instruct, Evol-Instruct?
…Instruction tuning (дообучение по инструкциям) **[[Вики/Instruction tuning\|Instruction tuning]]** — это этап дообучения [[Вики/LLM\|LLM]] на парах «[[Вики/промпт…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать Evol-Instruct для instruction tuning
…Связанные вопросы из базы знаний | Вопрос | Тема | |--------|------| | 12 | What is the difference between supervised fine-tuning and instruction tuning? | | 45…
- wikiProgressive training
…Как вы генерируете синтетический датасет для instruction tuning Self-instruct, Evol-Instruct|681. Как вы генерируете синтетический датасет для instruction…
- wikiSynthetic dataset
…Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[263. Как вы…
- wikidownstream metrics
…Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[375. Как вы…
- answerКак вы генерируете synthetic данные для instruction tuning?
…Позволяют быстро получить размеченные [[Вики/датасеты\|датасеты]] для задач, где трудно собрать реальные примеры. - **[[Вики/Instruction tuning\|Instruction tuning]]** — этап…
- wikiback-translation
…Как вы генерируете синтетический датасет для instruction tuning Self-instruct, Evol-Instruct|681. Как вы генерируете синтетический датасет для instruction…
- wikiдатасеты
…Как вы генерируете synthetic данные для instruction tuning|514. Как вы генерируете synthetic данные для instruction tuning]] - [[523. Как вы…
- wikiAlpaca-format
…с полями instruction, input, output, альтернатива ChatML для малых моделей. ## Где встречается - [[33. Какие фреймворки для fine-tuning вы используете…
- answerКак fine-tune модель для следования сложным инструкциям?
…Fine-tuning для инструкций (Instruction Tuning) **[[Вики/Instruction tuning\|Instruction tuning]]** — это этап дообучения языковой модели на размеченных примерах, где…
- wikiHugging Face TRL
…Как вы генерируете synthetic данные для instruction tuning|514. Как вы генерируете synthetic данные для instruction tuning]] - [[579. Как работает…
- wikiablation study
…Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[374. Как вы…
- wikiWizardLM
# WizardLM ## Определение Модель, обученная с использованием метода Evol-Instruct для генерации сложных инструкций, улучшающих качество instruction tuning. ## Где встречается - [[800…
- wikiduplicate detection
…Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[266. Как вы…
- wikidataset format
# dataset format ## Определение Структура данных, определяющая порядок хранения примеров для обучения модели, например для задач function call или instruction tuning…
- wikiRule-based executor
…Как вы генерируете синтетический датасет для instruction tuning Self-instruct, Evol-Instruct|681. Как вы генерируете синтетический датасет для instruction…
- wikilow-quality filtering
…data) для удаления примеров низкого качества, чтобы повысить эффективность instruction tuning. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…