Поиск
- wikiData Augmentation for Code
# Data Augmentation for Code ## Определение Разработка пайплайна аугментации исходного кода для повышения устойчивости моделей машинного обучения к поверхностным изменениям. ## Где…
- wikiParrot
# Parrot ## Определение Библиотека для парафразирования текстов на основе модели T5, применяемая для data augmentation. ## Где встречается - [[683. Что такое data…
- wikiCode Summarization
…Используется как альтернативная метрика для оценки устойчивости моделей к data augmentation. ## Где встречается - [[272. Настроить data augmentation для кода|272…
- wikiCodeBERT
…Используется для оценки влияния data augmentation на предсказания и в задачах code embeddings. ## Где встречается - [[272. Настроить data augmentation для…
- wikinoise-based augmentation
# noise-based augmentation ## Определение Техника увеличения разнообразия обучающих данных путём внесения контролируемого шума (замена синонимов, вставка/удаление токенов). Повышает устойчивость…
- wikiData augmentation
# Data augmentation ## Определение Метод увеличения размера датасета путём создания синтетических примеров, например перефразирование или back-translation, для повышения разнообразия и…
- wikiCodeSearchNet
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiunittest
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikilibcst
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiPegasus
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikiRobustness Evaluation
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiAdversarial Examples for Code
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiCode Clone Detection
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikinlpaug
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikiCode Classification
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiFunction Permutation
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiVariable Renaming
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiEntity Masking
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikiSpan Masking
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikiNMT
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikiblack
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] - [[297. Агент с внешними API (Slack, Gmail, Calendar)|297…
- wikiSynthetic dataset
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- answerЧто такое data augmentation для LLM (back-translation, paraphrasing, masking)?
…Data Augmentation для LLM **[[Вики/Data augmentation\|Data augmentation]]** — это процесс создания модифицированных копий существующих данных с сохранением их смысла…
- wikiflake8
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiAgreement
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiPEP 8
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] - [[290. Реализовать swarm coordination|290. Реализовать swarm coordination]] ## Навигация…
- wikiSynonym swap
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikiWordNet
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikicode generation
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikinoise injection
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikiTextAttack
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikiT5
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikiJSONL
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiValidation set
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikiSQuAD
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikiGit
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiSwap
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikisynthetic data generation
# synthetic data generation ## Определение Процесс создания искусственных данных (вопросов, пар вопрос-ответ) с помощью LLM для обучения, дообучения или оценки…
- answerКакой размер датасета нужен для fine-tuning?
…Data augmentation для маленьких датасетов Если [[Вики/dataset\|датасет]] меньше 500 примеров, обязательно применяйте [[Вики/Synthetic dataset\|data augmentation]]: - [[Вики…
- wikiHumanEval
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…
- wikiback-translation
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikipre-training
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikiInstruction tuning
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikiRandom swap
…Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…
- wikiдатасеты
…Настроить data augmentation для кода|272. Настроить data augmentation для кода]] - [[277. Реализовать LLM-as-Judge с калибровкой|277. Реализовать…
- wikiмаскировка
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать Evol-Instruct для instruction tuning
…Определить список эволюционных операторов (Evol‑Instruct): - [[Вики/Data augmentation\|Deepening]] (добавить шаги, сделать более сложной) - [[Вики/Data augmentation\|Widening]] (расширить…
- answerКак вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами?
…очистка от [[Вики/PII\|PII]], [[Вики/Filtering\|фильтрация]] шума, балансировка, [[Вики/Data augmentation\|аугментация]] для разнообразия и автоматическая [[Вики/Evaluation…
- answerКак вы генерируете synthetic данные для instruction tuning?
…Полезен, когда есть корпус хороших ответов, но нет инструкций. - **[[Вики/Data augmentation\|Data augmentation]]** — модифицируют существующие инструкции ([[Вики/Synonym swap…
- wikiOverfitting
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…