2016-07-26 11 views
-3

У меня есть данные из анкеты обследования, как это:Граф определенного значения в столбце

survey <- data.frame(
    ID = sample(1:10), 
    Var1 = sample(c("yes", "no"), 10, replace = TRUE), 
    Var2=sample(c("DNK", "yes", "no"), 10, replace = TRUE), 
    Var3=sample(c("DNK", "PNA", "yes", "no"), 10, replace = TRUE), 
    Var4=sample(c("DNK", "PNA", "yes", "no"), 10, replace = TRUE) 
    ) 

Я хочу знать, какая переменная имеет наиболее DNK и PNA responses.I думаю, что это будет функция цикла, но я могу Кажется, это не так.
То есть, я хочу, выход с кол-PNA/DNK для каждой переменной: например)

Var3: DNK 4 
Var3: DNK 3, PNA 1 
Var4: DNK 1, PNA 3 
+0

'lapply (survey [, -1], table)' – Roland

ответ

0

Благодарим за ответы. Используя предоставленные ответы, это то, что я искал: dnk=apply(subset[,1:dim(survey)[2]], 2, function(x) length(which(x=="DNK")))

1

Я хотел бы использовать: occurrences <- apply(survey, 2, table)

Это будет возвращает список occurrences, где пункт i содержит количество вхождений каждого элемента столбца i.

Теперь это только вопрос печати или хранения вывода (в зависимости от того, что вы хотите). Вы можете распечатать их, выполнив следующие действия:

for (i in 1:length(occurrences)){ 
print(occurrences[i]) 
}