English translation is not available yet. Showing Russian content.
Common Crawl
Common Crawl
Определение
Открытый корпус веб-данных, часто используемый для предобучения языковых моделей и для проверки на контаминацию бенчмарками.
Где встречается
- 488. Что такое benchmark contamination и как ее детектировать
- 689. Как вы проектируете dynamic benchmark (меняющийся со временем)