CoNLL-2003
CoNLL-2003
Определение
CoNLL-2003 — это стандартный датасет для задачи распознавания именованных сущностей (NER), выпущенный в рамках конференции CoNLL-2003. Он содержит английские и немецкие новостные тексты с разметкой четырех типов сущностей: PER, ORG, LOC, MISC. Датасет широко используется для обучения и оценки моделей NER, включая архитектуры BiLSTM-CRF.
Где встречается
- 903. Что такое NER (Named Entity Recognition)? Как извлекать организации, даты и персоны из текста с помощью библиотеки DeepPavlov?
- 905. Как вы оцениваете качество модели NER? Почему micro-F1 и macro-F1 могут давать разную картину?
- 945. Как работает CRF (Conditional Random Field) сверху BiLSTM для NER? Зачем нужен слой CRF?