2016-10-18 7 views
0

При импорте данных из файла excel с использованием функции read_excel в пакет readxl я попытался указать число для аргумента na, но он не перекодирует отсутствующие значения. Данные были введены с числовым значением в качестве отсутствующего ответа.read_excel номер перекоса как значение na

Пример данных (в г, а не Excel файл, хотя):

missing <- data.frame(a = c(1, 2, 3, 4), 
         b = c(99, 2, 3, 4), 
         c = c(1, 99, 3, 4)) 

Если приведенные выше данные были отдельно Excel файл Я попытался читать его в следующим образом:

data <- read_excel("C:/.../missing.xlsx", na = 99) 

Вместо переписывая 99-ые как NA, они просто читаются как числа. Я хотел бы видеть кадр данных, как это без необходимости использовать отдельный шаг перекодировать данные:

a b c 
1 1 NA 1 
2 2 2 NA 
3 3 3 3 
4 4 4 4 

ответ

0

read_excel ищет строку. Так что вам просто нужно ввести

data <- read_excel("C:/.../missing.xlsx", na = "99")

+0

Я попытался это с небольшой пример данных, и она работала, но она не работает для набора данных с 2000+ строк и 7 столбцов. –

+0

На самом деле это может иметь отношение к числу, которое я пытаюсь заменить. Фактические данные варьируются от 1 до 4 с моими отсутствующими значениями, введенными как 5. Функция «summary» просто говорит, что max равен 5. Когда я делаю это, чтобы заменить 99, он работает. –

+0

На самом деле, возможно, последняя мысль. Будет ли «защищенная точка зрения» вызвать проблемы с этим? Файлы были загружены из Интернета, и я не открыл их в excel. Я думал, что это будет исключительно удачей, но когда я открыл файлы и сохранил их, это сработало. –