Поиск
- wikiContamination Detection Toolkit
# Contamination Detection Toolkit ## Определение Python-библиотека для обнаружения утечки данных (data contamination) в оценочных датасетах с помощью методов MIA и…
- wikiContamination rate
…Как вы детектируете data contamination в evaluation датасетах|350. Как вы детектируете data contamination в evaluation датасетах]] ## Навигация - [[00. Индекс…
- wikiутечка данных
…Как вы детектируете data contamination в evaluation датасетах|350. Как вы детектируете data contamination в evaluation датасетах]] - [[488. Что такое…
- wikiLM Contamination
…Как вы детектируете data contamination в evaluation датасетах|350. Как вы детектируете data contamination в evaluation датасетах]] ## Навигация - [[00. Индекс…
- wikiLiveBench
# LiveBench ## Определение Динамический бенчмарк для LLM, который еженедельно обновляется на основе свежих новостей, чтобы избежать data contamination и обеспечить объективную…
- wikin-gram overlap
…Как вы детектируете data contamination в evaluation датасетах|350. Как вы детектируете data contamination в evaluation датасетах]] - [[488. Что такое…
- wikiGoogle C4 dataset
…Как вы детектируете data contamination в evaluation датасетах|350. Как вы детектируете data contamination в evaluation датасетах]] - [[689. Как вы…
- wikiperplexity analysis
# perplexity analysis ## Определение Using model perplexity on evaluation samples to identify unusually low perplexity indicative of data contamination. ## Где встречается…
- wikiHoldout set
…Как вы детектируете data contamination в evaluation датасетах|350. Как вы детектируете data contamination в evaluation датасетах]] - [[391. Как вы…
- wikiLikelihood Ratio Attack
…Как вы детектируете data contamination в evaluation датасетах|350. Как вы детектируете data contamination в evaluation датасетах]] - [[602. Как работает…
- wikicanary examples
…Добавляются в обучающую выборку для выявления утечки данных (data contamination) при оценке модели. ## Где встречается - [[869. Как избежать benchmark contamination…
- wikianti-contamination
# anti-contamination ## Определение Меры по предотвращению попадания тестовых данных в обучающий набор, чтобы оценивать модели на невиденных ранее вопросах. ## Где…
- wikimembership inference attack
…Как вы детектируете data contamination в evaluation датасетах|350. Как вы детектируете data contamination в evaluation датасетах]] - [[351. Как работает…
- answerКак вы детектируете data contamination в evaluation датасетах?
…Как вы детектируете data contamination в evaluation датасетах? ## Краткий тезис [[Вики/утечка данных\|Data contamination]] (или [[Вики/утечка данных\|data…
- wikiWIMBD
…Как избежать benchmark contamination (когда модель видела тестовые данные)|869. Как избежать benchmark contamination (когда модель видела тестовые данные)]] ## Навигация…
- wikiLoss-based MIA
…Как вы детектируете data contamination в evaluation датасетах|350. Как вы детектируете data contamination в evaluation датасетах]] ## Навигация - [[00. Индекс…
- wikiAUC
…Как вы детектируете data contamination в evaluation датасетах|350. Как вы детектируете data contamination в evaluation датасетах]] - [[81. Спроектировать uncertainty…
- wikidata lineage
…Как вы проектируете data lineage для RAG (от документа к ответу)]] - [[869. Как избежать benchmark contamination (когда модель видела тестовые…
- wikiMinHash
…Как вы делаете data quality monitoring для RAG корпуса]] - [[488. Что такое benchmark contamination и как ее детектировать|488. Что…
- answerКак избежать benchmark contamination (когда модель видела тестовые данные)?
…Benchmark Contamination [[Вики/утечка данных\|Benchmark contamination]] (также известная как **[[Вики/утечка данных\|data leakage]]** или **[[Вики/n-gram overlap…
- answerЧто такое benchmark contamination и как ее детектировать?
…сет). [[Вики/утечка данных\|Contamination]] — частный случай [[Вики/утечка данных\|data leakage]]. --- ## 3. Методы детекции contamination ### 3.1 N-gram…
- answerКак вы обнаруживаете contamination (пересечение synthetic данных с тестовыми)?
…Data contamination (загрязнение данных) [[Вики/утечка данных\|Data contamination]] — это нежелательное пересечение между обучающей и тестовой выборками. В контексте [[Вики…
- wikishadow model
…Как вы детектируете data contamination в evaluation датасетах|350. Как вы детектируете data contamination в evaluation датасетах]] - [[357. Как работает…
- wikiOpenAI Evals
…Что такое benchmark contamination и как ее детектировать]] - [[686. Как работает synthetic data для RLHF (предпочтения)|686. Как работает synthetic…
- wikiNLTK
…Как вы обнаруживаете contamination (пересечение synthetic данных с тестовыми)]] - [[95. Написать runbook для synthetic data collapse|95. Написать runbook для…
- wikiдатасеты
…Как вы детектируете data contamination в evaluation датасетах|350. Как вы детектируете data contamination в evaluation датасетах]] - [[352. Что такое…
- wikispaCy
…Как вы делаете data quality monitoring для RAG корпуса]] - [[693. Как вы обнаруживаете contamination (пересечение synthetic данных с тестовыми)|693…
- wikiHellaSwag
…Что такое benchmark contamination и как ее детектировать|488. Что такое benchmark contamination и как ее детектировать]] - [[498. Что такое…
- wikiSQuAD
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)]] - [[693. Как вы обнаруживаете contamination (пересечение synthetic данных с тестовыми…
- wikiTraining Data Poisoning
# Training Data Poisoning ## Определение Атака, при которой в обучающие данные внедряются вредоносные примеры, чтобы модель усвоила бэкдоры или неправильное поведение…
- wikianswer_exact_match
…Как вы детектируете data contamination в evaluation датасетах|350. Как вы детектируете data contamination в evaluation датасетах]] - [[488. Что такое…
- wikiстатистическая значимость
…Как вы детектируете data contamination в evaluation датасетах|350. Как вы детектируете data contamination в evaluation датасетах]] - [[399. Как вы…
- wikiLoss
…Как избежать benchmark contamination (когда модель видела тестовые данные)|869. Как избежать benchmark contamination (когда модель видела тестовые данные)]] - [[800…
- wikiSynthetic dataset
# Synthetic dataset ## Определение Искусственно созданный набор данных, сгенерированный с помощью LLM или других методов, используемый для обучения, fine-tuning или…
- answerЧто такое benchmark chasing и почему это опасно?
…четыре основные угрозы ### 2.1 Data contamination (загрязнение данных) [[Вики/n-gram overlap\|Data contamination]] — это когда данные, использованные для…
- wikiscikit-learn
…Как вы обнаруживаете contamination (пересечение synthetic данных с тестовыми)|693. Как вы обнаруживаете contamination (пересечение synthetic данных с тестовыми)]] - [[699…
- wikiData parallelism
…Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…
- wikiOverfitting
…Что такое data augmentation для LLM (back-translation, paraphrasing, masking)|683. Что такое data augmentation для LLM (back-translation, paraphrasing…
- wikiModel Poisoning
…Что такое data poisoning атака на fine-tuning и как защититься|356. Что такое data poisoning атака на fine-tuning…
- wikiduplicate detection
…Как вы делаете data quality monitoring для RAG корпуса|275. Как вы делаете data quality monitoring для RAG корпуса]] - [[357…
- wikiMMLU
…Что такое benchmark contamination и как ее детектировать|488. Что такое benchmark contamination и как ее детектировать]] - [[489. Что такое…
- wikiGSM8K
…Что такое benchmark contamination и как ее детектировать|488. Что такое benchmark contamination и как ее детектировать]] - [[498. Что такое…
- wikiPerplexity
…Как вы детектируете data contamination в evaluation датасетах|350. Как вы детектируете data contamination в evaluation датасетах]] - [[351. Как работает…
- answerКак вы проектируете dynamic benchmark (меняющийся со временем)?
…dataset\|датасет]], только [[Вики/API\|API]]), **[[Вики/secret rotation\|ротация]]** вопросов с ограниченным сроком жизни и [[Вики/anti-contamination\|анти…
- wikiforward pass
…Tensor parallelism vs pipeline parallelism vs data parallelism — сравните для LLM инференса.|203. Tensor parallelism vs pipeline parallelism vs data…
- wikiSFT
…Что такое benchmark contamination и как ее детектировать|488. Что такое benchmark contamination и как ее детектировать]] - [[489. Что такое…
- answerЧто такое meta-evaluation бенчмарков (оценка оценки)?
…Основные проблемы бенчмарков, которые выявляет meta-evaluation | Проблема | Описание | Пример | |----------|----------|--------| | [[Вики/n-gram overlap\|Data contamination]] (утечка данных) | Тестовые примеры…
- wikireward model
…Как работает synthetic data для RLHF (предпочтения)|686. Как работает synthetic data для RLHF (предпочтения)]] - [[693. Как вы обнаруживаете contamination…
- wikiFew-shot examples
…Как вы делаете synthetic data generation для редких классов в датасете|523. Как вы делаете synthetic data generation для редких…
- answerЧто такое synthetic eval collapse и как его предотвратить?
…пользователи начинают задавать вопросы по-новому). - [[Вики/утечка данных\|Data contamination]] — если синтетические примеры случайно попали в обучающую выборку, [[Вики…