中文翻译暂不可用,显示俄语原文。
n-gram overlap
n-gram overlap
Определение
Метод обнаружения contamination (засорения) данных путём измерения перекрытия n-грамм между тестовым и обучающим наборами; порог 50% указывает на возможное пересечение.
Где встречается
- 350. Как вы детектируете data contamination в evaluation датасетах
- 488. Что такое benchmark contamination и как ее детектировать
- 689. Как вы проектируете dynamic benchmark (меняющийся со временем)
- 693. Как вы обнаруживаете contamination (пересечение synthetic данных с тестовыми)
- 869. Как избежать benchmark contamination (когда модель видела тестовые данные)
- 876. Как избежать evaluation overfitting (когда модель учится на тесте)
- 800+ вопросов
- 154. Протестировать multi-turn диалоги
- 230. RAG с DSPy оптимизацией