У меня есть набор данных похожи на следующий файл сResampling с пандами
2013-05-30 06:00:41 173.199.116.171
2013-05-30 06:05:41 61.245.172.14
2013-05-30 06:10:42 74.86.158.106
2013-05-30 06:20:42 61.245.172.14
Я хочу ресэмплировать это в течение 20 минут и получить количество попаданий за определенные 20 минут временного интервала. (Например, между (06.00.00 -06.20.00 или 06.40.00-07.00.00 и т.д.). Я могу напечатать счетчик совпадений для всего файла данных следующим образом.
ips = df.groupby('IP').size()
Как получить количество попаданий за каждые 20 минут слотов? После код просто распечатает все IP-адреса между '06: 00: 00 'и '06: 20: 00.
df_s = df['IP'].resample('20t', how='count')
print df['IP'].between_time('06:00:00', '06:20:00')
Что ваши df_s выглядеть? Я не думаю, что могу воспроизвести его с помощью pandas 0.11. Мой слот 6:00 содержит три удара и мой слот 6:20 1. Попробовали ли вы установить ключевые слова 'closed =' и 'label ='? Определение контейнеров по умолчанию может отличаться от того, что вы ожидаете. –
@ Rutger Kassies Как насчет этого? Но я должен указать временной интервал? new = DataFrame (df ['IP']. между_time ('06: 00: 00 ', '06: 20: 00')) t = new.groupby ('IP'). size() –