2015-07-13 4 views
1

Я хочу знать, если я могу проверить, начинается ли столбец кадра данных с 0 или 1 и идет до количества строк без нарушения последовательности. Ниже приведен примерный кадр данных.Проверьте, содержит ли столбец последовательность

structure(list(X = 1:22, SNR = c(1.0035798429, 11.9438978154, 
NA, 3.2894877794, 4.0170266411, 1.6310522977, 1.6405414787, 1.6625412522, 
0.8489116253, 7.5312259672, 7.2832910726, 0.5732577083, NA, 0.8149754292, 
1.9981020389, 1.2477052103, 0.9960804911, 10.3402683931, 3.6328270728, 
2.5540496855, 41.96873985, 6.2035281045), ID = c(109L, 110L, 
111L, 112L, 113L, 114L, 116L, 117L, 118L, 119L, 120L, 121L, 123L, 
124L, 125L, 126L, 127L, 128L, 130L, 131L, 132L, 133L), SignalIntensity = c(6.8173738339, 
11.5459925418, NA, 9.7804203445, 9.8719842219, 9.0781857736, 
8.2289312163, 8.0435364446, 6.1793458315, 10.5581798932, 10.4745329822, 
4.1572943809, NA, 6.0451742752, 8.3100219509, 7.4558770659, 7.1464749962, 
11.4284386394, 9.6273795753, 9.6807417299, 13.3364944397, 10.4304671876 
)), .Names = c("X", "SNR", "ID", "SignalIntensity"), class = "data.frame", row.names = c(NA, 
-22L)) 

Как я могу проверить столбцы и вернуть индекс, если они есть.

Отредактировано: Последовательность, которую я ищу, является естественной последовательностью. Предположим, что если в кадре данных есть 10 строк, то столбец, если он присутствует, должен иметь последовательность 1,2,3,4,5,6,7,8,9,10 или может быть как 0,1,2,3,4,5,6,7,8,9. , Таким образом, последовательность начинается с 0 или 1 и идет до количества строк с шагом в 1 для каждой строки.

+0

Чистый вопрос, беспорядочный образец данных. –

+0

Без нарушения какой последовательности? Ведущий нуль или один не делает последовательность. –

+0

@MikeWise сказать, что последовательность натуральных чисел –

ответ

3

Вы можете пройти через столбцы с помощью sapply. Создайте функцию для проверки наличия каких-либо НС. Если нет (!any), мы получим разницу (diff) между соседним элементом, проверьте, равна ли все разности элементов 1 (all(diff(x)==1) и (&), первое значение столбца равно 0 или 1 (x[1] %in% 0:1). Если есть NA, вывод для этого столбца будет «FALSE».

f1 <- function(x) { 
      if(!any(is.na(x))) 
     all(diff(x)==1) & x[1] %in% 0:1 
     else FALSE} 
which(sapply(df, f1)) 
#X 
#1 
+0

это возвращает индекс? –

+0

@MikeWise Я думал, что OP хочет логический индекс столбцов. Я могу ошибаться. – akrun

+0

Если у меня есть список фреймов данных, как я могу проверить все –