С data.frame, содержащим идентификатор пользователя и метку времени, есть быстрый способ извлечь идентификаторы пользователей, которые достигают определенного количества с помощью шкалы времени скольжения.R Считывание числа ошибок в скользящем окне
Например, если я хочу найти всех пользователей, которые появляются 10 раз в течение 30 секунд.
Мои мысли состоят в первом подмножестве только для пользователей, которые достигают целевого счета (10) во всем файле данных. Затем вычтите первый временной штамп от последнего для каждого пользователя - если он меньше временной шкалы (30 секунд), добавьте в целевой список.
Если нет, то сначала проверить со вторым, первым с третьим и продолжать движение до достижения предельного времени (30 секунд) или целевого счета (10 раз). По достижении предельного времени мне нужно будет проверить второй с текущим элементом.
Возможно, есть библиотека, которая поможет выявить эти или некоторые формы стандартного отклонения, возможно, даже кластеризации, чтобы помочь выявить и извлечь меньший поднабор?