Поиск

  • wikiInstruction tuning

    # Instruction tuning ## Определение Процесс дообучения LLM на наборе инструкций и ответов для улучшения следования инструкциям. ## Где встречается - [[29. Как fine…

  • wikiEvol-Instruct

    …Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[514. Как вы…

  • wikiAxolotl

    …Как вы генерируете synthetic данные для instruction tuning|514. Как вы генерируете synthetic данные для instruction tuning]] - [[681. Как вы…

  • wikiSelf-instruct

    …Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[514. Как вы…

  • wikiReverse Instruction

    …Как вы генерируете synthetic данные для instruction tuning|514. Как вы генерируете synthetic данные для instruction tuning]] ## Навигация - [[00. Индекс…

  • wikiInstruction Formatting

    # Instruction Formatting ## Определение Преобразование диалогов в формат инструкция-ответ для fine-tuning. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00…

  • wikiLIMA

    # LIMA ## Определение Подход к instruction tuning с минимальным количеством (около 1000) тщательно отобранных синтетических пар. ## Где встречается - [[259. Как вы…

  • wikiRandom injection

    # Random injection ## Определение Оператор аугментации данных, вставляющий случайный токен в текст для улучшения instruction tuning. ## Где встречается - [[267. Реализовать Evol…

  • wikiFlan-T5-small

    # Flan-T5-small ## Определение Модель google/flan-t5-small, используемая для демонстрации instruction tuning. ## Где встречается - [[267. Реализовать Evol-Instruct…

  • wikiDistilabel

    # Distilabel ## Определение Библиотека для синтеза данных с поддержкой методов Self-Instruct, Evol-Instruct и фильтрации, используемая для instruction tuning. ## Где…

  • wikiseed examples

    …Как вы генерируете synthetic данные для instruction tuning|514. Как вы генерируете synthetic данные для instruction tuning]] - [[681. Как вы…

  • wikiUnnatural Instructions

    …Как вы генерируете синтетический датасет для instruction tuning Self-instruct, Evol-Instruct|681. Как вы генерируете синтетический датасет для instruction

  • wikiAlpaca-LoRA

    …Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] ## Навигация - [[00. Индекс…

  • wikiMagpie

    …Используется для instruction tuning. ## Где встречается - [[514. Как вы генерируете synthetic данные для instruction tuning|514. Как вы генерируете synthetic…

  • wikiSelf-QA

    # Self-QA ## Определение Метод генерации вопрос-ответных пар на основе документов для instruction tuning ретривер-агента в RAG. ## Где встречается…

  • wikiChain-of-Thought generation

    …Применяется при создании синтетических данных для instruction tuning. ## Где встречается - [[259. Как вы генерируете synthetic данные для instruction tuning|259…

  • wikiinstruction format

    # instruction format ## Определение Формат данных для fine-tuning (система + пользователь + ассистент), критичен для консистентности обучения. Использует шаблоны вроде <|user|>...<|assistant…

  • wikiPhi-3-mini

    …Реализовать Evol-Instruct для instruction tuning|267. Реализовать Evol-Instruct для instruction tuning]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikiLLaMA-Factory

    …Какие фреймворки для fine-tuning вы используете]] - [[681. Как вы генерируете синтетический датасет для instruction tuning Self-instruct, Evol-Instruct…

  • wikiInstructLab

    …Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] ## Навигация - [[00. Индекс…

  • wikiBacktranslation

    …Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] ## Навигация - [[00. Индекс…

  • wikiSeed pool

    …Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] ## Навигация - [[00. Индекс…

  • wikiData augmentation

    …Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[261. Как вы…

  • wikiZero-shot generalization

    …Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] ## Навигация - [[00. Индекс…

  • wikiPairwise cosine distance

    …Реализовать Evol-Instruct для instruction tuning|267. Реализовать Evol-Instruct для instruction tuning]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikiRule-based filtering

    …Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] ## Навигация - [[00. Индекс…

  • wikiSemantic distance

    …Реализовать Evol-Instruct для instruction tuning|267. Реализовать Evol-Instruct для instruction tuning]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • answerКак вы генерируете synthetic данные для instruction tuning?

    …В контексте [[Вики/Instruction tuning\|instruction tuning]] ([[Вики/SFT\|дообучение]] [[Вики/LLM\|LLM]] на наборе инструкций и ожидаемых ответов) [[Вики…

  • wikiN-gram novelty

    …Реализовать Evol-Instruct для instruction tuning|267. Реализовать Evol-Instruct для instruction tuning]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikiSFTTrainer

    …Как вы генерируете синтетический датасет для instruction tuning Self-instruct, Evol-Instruct|681. Как вы генерируете синтетический датасет для instruction

  • wikiFiltering

    …Как вы генерируете synthetic данные для instruction tuning|514. Как вы генерируете synthetic данные для instruction tuning]] ## Навигация - [[00. Индекс…

  • wikiArgilla

    …Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[333. Что такое…

  • wikiJaccard similarity

    …Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[800+ вопросов|800…

  • answerКак вы генерируете синтетический датасет для instruction tuning? Self-instruct, Evol-Instruct?

    Instruction tuning (дообучение по инструкциям) **[[Вики/Instruction tuning\|Instruction tuning]]** — это этап дообучения [[Вики/LLM\|LLM]] на парах «[[Вики/промпт…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать Evol-Instruct для instruction tuning

    …Связанные вопросы из базы знаний | Вопрос | Тема | |--------|------| | 12 | What is the difference between supervised fine-tuning and instruction tuning? | | 45…

  • wikiProgressive training

    …Как вы генерируете синтетический датасет для instruction tuning Self-instruct, Evol-Instruct|681. Как вы генерируете синтетический датасет для instruction

  • wikiSynthetic dataset

    …Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[263. Как вы…

  • wikidownstream metrics

    …Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[375. Как вы…

  • answerКак вы генерируете synthetic данные для instruction tuning?

    …Позволяют быстро получить размеченные [[Вики/датасеты\|датасеты]] для задач, где трудно собрать реальные примеры. - **[[Вики/Instruction tuning\|Instruction tuning]]** — этап…

  • wikiback-translation

    …Как вы генерируете синтетический датасет для instruction tuning Self-instruct, Evol-Instruct|681. Как вы генерируете синтетический датасет для instruction

  • wikiдатасеты

    …Как вы генерируете synthetic данные для instruction tuning|514. Как вы генерируете synthetic данные для instruction tuning]] - [[523. Как вы…

  • wikiAlpaca-format

    …с полями instruction, input, output, альтернатива ChatML для малых моделей. ## Где встречается - [[33. Какие фреймворки для fine-tuning вы используете…

  • answerКак fine-tune модель для следования сложным инструкциям?

    …Fine-tuning для инструкций (Instruction Tuning) **[[Вики/Instruction tuning\|Instruction tuning]]** — это этап дообучения языковой модели на размеченных примерах, где…

  • wikiHugging Face TRL

    …Как вы генерируете synthetic данные для instruction tuning|514. Как вы генерируете synthetic данные для instruction tuning]] - [[579. Как работает…

  • wikiablation study

    …Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[374. Как вы…

  • wikiWizardLM

    # WizardLM ## Определение Модель, обученная с использованием метода Evol-Instruct для генерации сложных инструкций, улучшающих качество instruction tuning. ## Где встречается - [[800…

  • wikiduplicate detection

    …Как вы генерируете synthetic данные для instruction tuning|259. Как вы генерируете synthetic данные для instruction tuning]] - [[266. Как вы…

  • wikidataset format

    # dataset format ## Определение Структура данных, определяющая порядок хранения примеров для обучения модели, например для задач function call или instruction tuning

  • wikiRule-based executor

    …Как вы генерируете синтетический датасет для instruction tuning Self-instruct, Evol-Instruct|681. Как вы генерируете синтетический датасет для instruction

  • wikilow-quality filtering

    …data) для удаления примеров низкого качества, чтобы повысить эффективность instruction tuning. ## Где встречается - [[800+ вопросов|800+ вопросов]] ## Навигация - [[00. Индекс…