Какой алгоритм/решение можно использовать для обозначения сходства (перекрытие/точность/отзыв/...) двух наборов диапазонов.Сходство двух наборов интервалов
я могу думать (или найти в Интернете) сотни подобных проблем, но никогда точно, но, конечно, это «колесо», должно быть, были изобретены уже ...
Допустим, что входные данные что-то вроде:
Real [ ## ### # ] or [(1,2),(4,6),(9,10)]
Predicted [ ## # ] or [(1,2),(4,4)]
Выход должен быть ~ 50%
Если я, например, растровые изображения, использовать интервальные деревьев или что? Есть ли хороший функциональный или простой в написании алгоритм? Любая значимая мера сходства будет делать, и так будет любой разумный формат ввода.
спасибо.
(реалистичная длина ~ 4000 с < 50 интервалов в каждом наборе)
Увлекательный. Пару дней назад немного поиграл с этим вопросом, который более или менее создает _dissimilarity_. Возможно, это предоставит ides. http://stackoverflow.com/questions/40367461/intersection-of-two-lists-of-ranges-in-python/40371246 – Gene
Я видел это. Решения кажутся необоснованно сложными и только доставят меня на полпути. Поскольку у меня нет ввода, вывода или ограничений по времени, я надеялся на какую-то «явно правильную» реализацию. – arctiq