Я провел анкетирование, в котором некоторые ответы были «Я не знаю» и «Я не хочу отвечать». Теперь мне нужно изменить те варианты ответа на «Н/Д», чтобы они не учитывались в статистических аналогах. Как мне это сделать?Изменение значения до N/A в Rstudio
ответ
Это довольно легко выполнить. Я делаю некоторые предположения относительно ваших данных, так как вы не предоставили формат. Давайте предположим, что у вас есть ваши данные в электронную таблицу первенствовать и вы импортировали его в R с помощью следующего кода:
## Import Data ##
require("gdata")
myData <-read.xls("myData.xlsx", stringsAsFactors = FALSE)
Хорошо, теперь у вас есть кадр данных в R называется myData
. Предположим, что есть столбец с именем Answers
, который содержит ответы как строки. У нас есть хорошие ответы, некоторые значения NA, а некоторые, которые говорят «Я не знаю», или «Я не хочу отвечать» или тому подобное.
Этот код изменит любые ответы, которые начинаются с «Я не» до NA.
myData$Answers[startsWith(myData$Answers,"I don't")] <- NA
Или вы могли бы указать ответить на каждый NA индивидуально
(например, если есть некоторые хорошие ответы, которые начинаются с «я не»).
myData$Answers[myData$Answers == "I don't know")] <- NA
myData$Answers[myData$Answers == "I don't want to answer")] <- NA
Или вы можете изменить все ответы, которые содержат определенную фразу в любом месте в своем ответе на NA
myData$Answers[grepl("don't know", myData$Answers)] <- NA
Если вы импортировали строки в качестве факторов, то приведенный выше код будет меняться следующим образом:
myData$Answers[grepl("don't know", levels(myData$Answers))] <- NA