Jaccard similarity
Jaccard similarity
Определение
Мера сходства множеств, вычисляемая как отношение пересечения к объединению. Используется для дедупликации документов или оценки идемпотентности ответов (порог ≥0.9).
Где встречается
- 257. Как вы дедуплицируете документы перед индексацией в RAG
- 259. Как вы генерируете synthetic данные для instruction tuning
- 800+ вопросов
- 160. Написать test plan для агента