中文翻译暂不可用,显示俄语原文。
Synthetic dataset
Synthetic dataset
Определение
Искусственно созданный набор данных, сгенерированный с помощью LLM или других методов, используемый для обучения, fine-tuning или оценки моделей вместо реальных данных.
Где встречается
- 71. Как вы тестируете RAG-систему на новых документах без реальных пользователей
- 259. Как вы генерируете synthetic данные для instruction tuning
- 263. Как вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)
- 494. Что такое synthetic eval collapse и как его предотвратить
- 514. Как вы генерируете synthetic данные для instruction tuning
- 518. Как вы обрабатываете PII в данных для RAG (GDPR, 152-ФЗ)
- 534. Как вы делаете data quality для синтетических датасетов
- 682. Как вы оцениваете качество синтетических данных (Self-consistency, LLM-as-Judge)
- 683. Что такое data augmentation для LLM (back-translation, paraphrasing, masking)
- 685. Как вы детектируете и удаляете низкокачественные примеры из синтетического датасета
- 686. Как работает synthetic data для RLHF (предпочтения)
- 690. Как вы измеряете diversity синтетического датасета
- 693. Как вы обнаруживаете contamination (пересечение synthetic данных с тестовыми)
- 694. Как работает weak supervision для synthetic данных (создание правил разметки)
- 695. Как вы делаете synthetic data для multi-turn диалогов (агентов)
- 700. Как вы комбинируете реальные и синтетические данные для максимального качества
- 866. Как генерировать synthetic датасеты для RAG evaluation
- Практика
- 800+ вопросов
- 43. Реализовать RRF (Reciprocal Rank Fusion)
- 46. Настроить cross-encoder reranking
- 48. Настроить click models для implicit feedback
- 63. Реализовать verifier-guided decoding
- 84. Реализовать conversational repair
- 85. Спроектировать escalation system
- 95. Написать runbook для synthetic data collapse
- 110. Реализовать quality gates для агента
- 143. Сравнить reserved vs spot vs on-demand
- 144. Настроить anomaly detection по cost
- 231. Agentic RAG с саморефлексией
- 235. LoRA для function calling
- 267. Реализовать Evol-Instruct для instruction tuning
- 270. Настроить RLAIF для генерации предпочтений
- 279. Настроить adversarial evaluation для RAG