Поиск

  • wikiSynthetic dataset

    # Synthetic dataset ## Определение Искусственно созданный набор данных, сгенерированный с помощью LLM или других методов, используемый для обучения, fine-tuning или…

  • wikisynthetic data collapse

    # synthetic data collapse ## Определение Явление деградации модели при обучении на синтетических данных, когда модель теряет качество из-за переобучения на…

  • wikisynthetic eval datasets

    # synthetic eval datasets ## Определение Синтетически созданные наборы данных для оценки производительности agentic workflows, имитирующие реальное взаимодействие пользователя с агентом. ## Где…

  • wikisynthetic data generation

    # synthetic data generation ## Определение Процесс создания искусственных данных (вопросов, пар вопрос-ответ) с помощью LLM для обучения, дообучения или оценки…

  • wikisynthetic generation

    …Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…

  • wikireal data mixing

    # real data mixing ## Определение Добавление реальных данных в обучающую выборку для предотвращения деградации модели (synthetic data collapse). ## Где встречается - [[688…

  • wikigsarti/synthetic_imdb

    …Написать runbook для synthetic data collapse|95. Написать runbook для synthetic data collapse]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikiSelf-instruct

    …Написать runbook для synthetic data collapse|95. Написать runbook для synthetic data collapse]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • answerКак вы комбинируете реальные и синтетические данные для максимального качества?

    …3 части [[Вики/Synthetic dataset\|synthetic]]** (25% [[Вики/real data\|real]], 75% [[Вики/Synthetic dataset\|synthetic]]). Почему? - Слишком много [[Вики…

  • wikibias amplification

    # bias amplification ## Определение Усиление существующих систематических ошибок модели в процессе обучения на синтетических данных (synthetic data collapse). ## Где встречается - [[688…

  • wikiJSONL

    …Сгенерировать synthetic датасет для RAG]] - [[271. Реализовать synthetic eval для агента|271. Реализовать synthetic eval для агента]] - [[272. Настроить data

  • wikiAxolotl

    …Как работает synthetic data для RLHF (предпочтения)|686. Как работает synthetic data для RLHF (предпочтения)]] - [[800+ вопросов|800+ вопросов]] ## Навигация…

  • answerКак работает synthetic data для RLHF (предпочтения)?

    …Как работает synthetic data для RLHF (предпочтения)? ## Краткий тезис [[Вики/Synthetic dataset\|Synthetic data]] ([[Вики/Synthetic dataset\|синтетические данные]]) для…

  • wikiData augmentation

    …Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…

  • wikiEvol-Instruct

    …Как работает synthetic data для RLHF (предпочтения)|686. Как работает synthetic data для RLHF (предпочтения)]] - [[866. Как генерировать synthetic датасеты…

  • wikiself-BLEU

    …Что такое synthetic data collapse (когда синтетические данные деградируют со временем)|688. Что такое synthetic data collapse (когда синтетические данные…

  • wikiOpenAI Evals

    …Как работает synthetic data для RLHF (предпочтения)|686. Как работает synthetic data для RLHF (предпочтения)]] - [[695. Как вы делаете synthetic

  • wikiутечка данных

    …Что такое synthetic data collapse (когда синтетические данные деградируют со временем)|688. Что такое synthetic data collapse (когда синтетические данные…

  • answerКак вы генерируете synthetic данные для instruction tuning?

    …Как вы генерируете synthetic данные для instruction tuning? ## Краткий тезис [[Вики/Synthetic dataset\|Synthetic data]] ([[Вики/Synthetic dataset\|синтетические данные…

  • answerЧто такое synthetic data collapse (когда синтетические данные деградируют со временем)?

    Synthetic data collapse (коллапс синтетических данных) [[Вики/synthetic data collapse\|Synthetic data collapse]] (также известен как [[Вики/synthetic data collapse…

  • wikispaCy

    …Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…

  • wikigenerator

    …Что такое synthetic data collapse (когда синтетические данные деградируют со временем)|688. Что такое synthetic data collapse (когда синтетические данные…

  • answerКак вы генерируете synthetic данные для instruction tuning?

    …Как вы генерируете synthetic данные для instruction tuning? ## Краткий тезис [[Вики/Synthetic dataset\|Synthetic data]] ([[Вики/Synthetic dataset\|синтетические данные…

  • wikiAG News

    …Написать runbook для synthetic data collapse|95. Написать runbook для synthetic data collapse]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikiVendi Score

    …Написать runbook для synthetic data collapse|95. Написать runbook для synthetic data collapse]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikiAgent-Eval

    …Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…

  • wikinlpaug

    …Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…

  • wikiinstructor

    …Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…

  • wikisacrebleu

    …Написать runbook для synthetic data collapse|95. Написать runbook для synthetic data collapse]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikiInstructLab

    # InstructLab ## Определение Фреймворк IBM для генерации synthetic data с участием сообщества. ## Где встречается - [[259. Как вы генерируете synthetic данные для…

  • wikiArgilla

    …Как вы генерируете synthetic данные для instruction tuning]] - [[333. Что такое preference data collection и как минимизировать bias в сравнениях…

  • wikiAPI call

    …Как вы делаете synthetic data для multi-turn диалогов (агентов)|695. Как вы делаете synthetic data для multi-turn диалогов…

  • wikiData-centric AI

    …Как работает weak supervision для synthetic данных (создание правил разметки)|694. Как работает weak supervision для synthetic данных (создание правил…

  • wikiOpenAI SDK

    …Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…

  • wikiScenario

    …Как вы делаете synthetic data для multi-turn диалогов (агентов)|695. Как вы делаете synthetic data для multi-turn диалогов…

  • wikiNLTK

    …Написать runbook для synthetic data collapse|95. Написать runbook для synthetic data collapse]] - [[227. RAG с гибридным поиском|227. RAG…

  • wikinext step accuracy

    …Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…

  • wikiSPIN

    …Как работает synthetic data для RLHF (предпочтения)|686. Как работает synthetic data для RLHF (предпочтения)]] ## Навигация - [[00. Индекс терминов|Индекс…

  • wikiensemble generation

    …Что такое synthetic data collapse (когда синтетические данные деградируют со временем)|688. Что такое synthetic data collapse (когда синтетические данные…

  • wikirandom deletion

    …Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…

  • wikirandom insertion

    …Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…

  • wikiTool failure

    …Как вы делаете synthetic data для multi-turn диалогов (агентов)|695. Как вы делаете synthetic data для multi-turn диалогов…

  • wikidiversity

    …Написать runbook для synthetic data collapse|95. Написать runbook для synthetic data collapse]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…

  • wikiexpected trajectory

    …Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] - [[800+ вопросов|800…

  • wikitask templates

    …Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…

  • wikipreference data collection

    …Как работает synthetic data для RLHF (предпочтения)|686. Как работает synthetic data для RLHF (предпочтения)]] - [[800+ вопросов|800+ вопросов]] - [[270…

  • wikiloss of diversity

    …Что такое synthetic data collapse (когда синтетические данные деградируют со временем)|688. Что такое synthetic data collapse (когда синтетические данные…

  • wikiпайплайн автоматического тестирования

    # пайплайн автоматического тестирования ## Определение CI/CD-пайплайн, автоматизирующий запуск тестов (включая регрессионные) на Golden Dataset для проверки качества агента или…

  • wikiMaximum Mean Discrepancy

    …Что такое data poisoning атака на fine-tuning и как защититься]] - [[494. Что такое synthetic eval collapse и как его…

  • wikimask-and-fill

    …Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…