Поиск
- wikiSynthetic dataset
# Synthetic dataset ## Определение Искусственно созданный набор данных, сгенерированный с помощью LLM или других методов, используемый для обучения, fine-tuning или…
- wikisynthetic data collapse
# synthetic data collapse ## Определение Явление деградации модели при обучении на синтетических данных, когда модель теряет качество из-за переобучения на…
- wikisynthetic eval datasets
# synthetic eval datasets ## Определение Синтетически созданные наборы данных для оценки производительности agentic workflows, имитирующие реальное взаимодействие пользователя с агентом. ## Где…
- wikisynthetic data generation
# synthetic data generation ## Определение Процесс создания искусственных данных (вопросов, пар вопрос-ответ) с помощью LLM для обучения, дообучения или оценки…
- wikisynthetic generation
…Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…
- wikireal data mixing
# real data mixing ## Определение Добавление реальных данных в обучающую выборку для предотвращения деградации модели (synthetic data collapse). ## Где встречается - [[688…
- wikigsarti/synthetic_imdb
…Написать runbook для synthetic data collapse|95. Написать runbook для synthetic data collapse]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiSelf-instruct
…Написать runbook для synthetic data collapse|95. Написать runbook для synthetic data collapse]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- answerКак вы комбинируете реальные и синтетические данные для максимального качества?
…3 части [[Вики/Synthetic dataset\|synthetic]]** (25% [[Вики/real data\|real]], 75% [[Вики/Synthetic dataset\|synthetic]]). Почему? - Слишком много [[Вики…
- wikibias amplification
# bias amplification ## Определение Усиление существующих систематических ошибок модели в процессе обучения на синтетических данных (synthetic data collapse). ## Где встречается - [[688…
- wikiJSONL
…Сгенерировать synthetic датасет для RAG]] - [[271. Реализовать synthetic eval для агента|271. Реализовать synthetic eval для агента]] - [[272. Настроить data…
- wikiAxolotl
…Как работает synthetic data для RLHF (предпочтения)|686. Как работает synthetic data для RLHF (предпочтения)]] - [[800+ вопросов|800+ вопросов]] ## Навигация…
- answerКак работает synthetic data для RLHF (предпочтения)?
…Как работает synthetic data для RLHF (предпочтения)? ## Краткий тезис [[Вики/Synthetic dataset\|Synthetic data]] ([[Вики/Synthetic dataset\|синтетические данные]]) для…
- wikiData augmentation
…Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…
- wikiEvol-Instruct
…Как работает synthetic data для RLHF (предпочтения)|686. Как работает synthetic data для RLHF (предпочтения)]] - [[866. Как генерировать synthetic датасеты…
- wikiself-BLEU
…Что такое synthetic data collapse (когда синтетические данные деградируют со временем)|688. Что такое synthetic data collapse (когда синтетические данные…
- wikiOpenAI Evals
…Как работает synthetic data для RLHF (предпочтения)|686. Как работает synthetic data для RLHF (предпочтения)]] - [[695. Как вы делаете synthetic…
- wikiутечка данных
…Что такое synthetic data collapse (когда синтетические данные деградируют со временем)|688. Что такое synthetic data collapse (когда синтетические данные…
- answerКак вы генерируете synthetic данные для instruction tuning?
…Как вы генерируете synthetic данные для instruction tuning? ## Краткий тезис [[Вики/Synthetic dataset\|Synthetic data]] ([[Вики/Synthetic dataset\|синтетические данные…
- answerЧто такое synthetic data collapse (когда синтетические данные деградируют со временем)?
…Synthetic data collapse (коллапс синтетических данных) [[Вики/synthetic data collapse\|Synthetic data collapse]] (также известен как [[Вики/synthetic data collapse…
- wikispaCy
…Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…
- wikigenerator
…Что такое synthetic data collapse (когда синтетические данные деградируют со временем)|688. Что такое synthetic data collapse (когда синтетические данные…
- answerКак вы генерируете synthetic данные для instruction tuning?
…Как вы генерируете synthetic данные для instruction tuning? ## Краткий тезис [[Вики/Synthetic dataset\|Synthetic data]] ([[Вики/Synthetic dataset\|синтетические данные…
- wikiAG News
…Написать runbook для synthetic data collapse|95. Написать runbook для synthetic data collapse]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiVendi Score
…Написать runbook для synthetic data collapse|95. Написать runbook для synthetic data collapse]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiAgent-Eval
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…
- wikinlpaug
…Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…
- wikiinstructor
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…
- wikisacrebleu
…Написать runbook для synthetic data collapse|95. Написать runbook для synthetic data collapse]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiInstructLab
# InstructLab ## Определение Фреймворк IBM для генерации synthetic data с участием сообщества. ## Где встречается - [[259. Как вы генерируете synthetic данные для…
- wikiArgilla
…Как вы генерируете synthetic данные для instruction tuning]] - [[333. Что такое preference data collection и как минимизировать bias в сравнениях…
- wikiAPI call
…Как вы делаете synthetic data для multi-turn диалогов (агентов)|695. Как вы делаете synthetic data для multi-turn диалогов…
- wikiData-centric AI
…Как работает weak supervision для synthetic данных (создание правил разметки)|694. Как работает weak supervision для synthetic данных (создание правил…
- wikiOpenAI SDK
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…
- wikiScenario
…Как вы делаете synthetic data для multi-turn диалогов (агентов)|695. Как вы делаете synthetic data для multi-turn диалогов…
- wikiNLTK
…Написать runbook для synthetic data collapse|95. Написать runbook для synthetic data collapse]] - [[227. RAG с гибридным поиском|227. RAG…
- wikinext step accuracy
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…
- wikiSPIN
…Как работает synthetic data для RLHF (предпочтения)|686. Как работает synthetic data для RLHF (предпочтения)]] ## Навигация - [[00. Индекс терминов|Индекс…
- wikiensemble generation
…Что такое synthetic data collapse (когда синтетические данные деградируют со временем)|688. Что такое synthetic data collapse (когда синтетические данные…
- wikirandom deletion
…Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…
- wikirandom insertion
…Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…
- wikiTool failure
…Как вы делаете synthetic data для multi-turn диалогов (агентов)|695. Как вы делаете synthetic data для multi-turn диалогов…
- wikidiversity
…Написать runbook для synthetic data collapse|95. Написать runbook для synthetic data collapse]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00…
- wikiexpected trajectory
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] - [[800+ вопросов|800…
- wikitask templates
…Как делать synthetic eval datasets для agentic workflows|875. Как делать synthetic eval datasets для agentic workflows]] ## Навигация - [[00. Индекс…
- wikipreference data collection
…Как работает synthetic data для RLHF (предпочтения)|686. Как работает synthetic data для RLHF (предпочтения)]] - [[800+ вопросов|800+ вопросов]] - [[270…
- wikiloss of diversity
…Что такое synthetic data collapse (когда синтетические данные деградируют со временем)|688. Что такое synthetic data collapse (когда синтетические данные…
- wikiпайплайн автоматического тестирования
# пайплайн автоматического тестирования ## Определение CI/CD-пайплайн, автоматизирующий запуск тестов (включая регрессионные) на Golden Dataset для проверки качества агента или…
- wikiMaximum Mean Discrepancy
…Что такое data poisoning атака на fine-tuning и как защититься]] - [[494. Что такое synthetic eval collapse и как его…
- wikimask-and-fill
…Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…