У меня есть файл CSV со столбцом, который имеет разные диапазоны дат для миллиона записей. Например, у меня есть что-то вроде этого: 2004-2016; 1980-2016; 1991-2006; 2000-2012; 1998 - 2011узнать наиболее часто встречающийся интервал дат из набора изменяющихся интервалов дат в python
Если я хочу узнать диапазон 3, 5 или 7 лет, который наиболее часто встречается во всех этих записях, как это сделать в Python? Не имеет значения, устранено ли несколько записей, но я пытаюсь выяснить, какая 7-часовая частота или 10-летняя частота наиболее распространены для всех диапазонов. Может кто-нибудь помочь?
Как вы загружаете данные? В списке, например '['2004-2016', '1980-2016', ...]'? – Reti43
С чем именно вам нужна помощь? Что вы пробовали, и где вы застреваете? Вы еще писали код? –