Поиск

  • wikiData Augmentation for Code

    # Data Augmentation for Code ## Определение Разработка пайплайна аугментации исходного кода для повышения устойчивости моделей машинного обучения к поверхностным изменениям. ## Где…

  • wikiParrot

    # Parrot ## Определение Библиотека для парафразирования текстов на основе модели T5, применяемая для data augmentation. ## Где встречается - [[683. Что такое data

  • wikiCode Summarization

    …Используется как альтернативная метрика для оценки устойчивости моделей к data augmentation. ## Где встречается - [[272. Настроить data augmentation для кода|272…

  • wikiCodeBERT

    …Используется для оценки влияния data augmentation на предсказания и в задачах code embeddings. ## Где встречается - [[272. Настроить data augmentation для…

  • wikinoise-based augmentation

    # noise-based augmentation ## Определение Техника увеличения разнообразия обучающих данных путём внесения контролируемого шума (замена синонимов, вставка/удаление токенов). Повышает устойчивость…

  • wikiData augmentation

    # Data augmentation ## Определение Метод увеличения размера датасета путём создания синтетических примеров, например перефразирование или back-translation, для повышения разнообразия и…

  • wikiCodeSearchNet

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiunittest

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikilibcst

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiPegasus

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • wikiRobustness Evaluation

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiAdversarial Examples for Code

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiCode Clone Detection

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikinlpaug

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • wikiCode Classification

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiFunction Permutation

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiVariable Renaming

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiEntity Masking

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • wikiSpan Masking

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • wikiNMT

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • wikiblack

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] - [[297. Агент с внешними API (Slack, Gmail, Calendar)|297…

  • wikiSynthetic dataset

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • answerЧто такое data augmentation для LLM (back-translation, paraphrasing, masking)?

    Data Augmentation для LLM **[[Вики/Data augmentation\|Data augmentation]]** — это процесс создания модифицированных копий существующих данных с сохранением их смысла…

  • wikiflake8

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiAgreement

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiPEP 8

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] - [[290. Реализовать swarm coordination|290. Реализовать swarm coordination]] ## Навигация…

  • wikiSynonym swap

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • wikiWordNet

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • wikicode generation

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikinoise injection

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • wikiTextAttack

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • wikiT5

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • wikiJSONL

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiValidation set

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • wikiSQuAD

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • wikiGit

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiSwap

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • wikisynthetic data generation

    # synthetic data generation ## Определение Процесс создания искусственных данных (вопросов, пар вопрос-ответ) с помощью LLM для обучения, дообучения или оценки…

  • answerКакой размер датасета нужен для fine-tuning?

    Data augmentation для маленьких датасетов Если [[Вики/dataset\|датасет]] меньше 500 примеров, обязательно применяйте [[Вики/Synthetic dataset\|data augmentation]]: - [[Вики…

  • wikiHumanEval

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] ## Навигация - [[00. Индекс терминов|Индекс терминов]] - [[00. Индекс разборов…

  • wikiback-translation

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • wikipre-training

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • wikiInstruction tuning

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • wikiRandom swap

    …Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…

  • wikiдатасеты

    …Настроить data augmentation для кода|272. Настроить data augmentation для кода]] - [[277. Реализовать LLM-as-Judge с калибровкой|277. Реализовать…

  • wikiмаскировка

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…

  • practiceТЕХНИЧЕСКОЕ ЗАДАНИЕ: Реализовать Evol-Instruct для instruction tuning

    …Определить список эволюционных операторов (Evol‑Instruct): - [[Вики/Data augmentation\|Deepening]] (добавить шаги, сделать более сложной) - [[Вики/Data augmentation\|Widening]] (расширить…

  • answerКак вы подготовите датасет для fine-tuning, если у вас только неструктурированные диалоги с клиентами?

    …очистка от [[Вики/PII\|PII]], [[Вики/Filtering\|фильтрация]] шума, балансировка, [[Вики/Data augmentation\|аугментация]] для разнообразия и автоматическая [[Вики/Evaluation…

  • answerКак вы генерируете synthetic данные для instruction tuning?

    …Полезен, когда есть корпус хороших ответов, но нет инструкций. - **[[Вики/Data augmentation\|Data augmentation]]** — модифицируют существующие инструкции ([[Вики/Synonym swap…

  • wikiOverfitting

    …Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…