MinHash

MinHash

Определение

Вероятностный алгоритм для оценки сходства множеств (Jaccard similarity), применяемый для дедупликации текстовых документов в RAG и near-duplicate detection.

Где встречается

Навигация