При импорте данных из файла excel с использованием функции read_excel
в пакет readxl
я попытался указать число для аргумента na
, но он не перекодирует отсутствующие значения. Данные были введены с числовым значением в качестве отсутствующего ответа.read_excel номер перекоса как значение na
Пример данных (в г, а не Excel файл, хотя):
missing <- data.frame(a = c(1, 2, 3, 4),
b = c(99, 2, 3, 4),
c = c(1, 99, 3, 4))
Если приведенные выше данные были отдельно Excel файл Я попытался читать его в следующим образом:
data <- read_excel("C:/.../missing.xlsx", na = 99)
Вместо переписывая 99-ые как NA, они просто читаются как числа. Я хотел бы видеть кадр данных, как это без необходимости использовать отдельный шаг перекодировать данные:
a b c
1 1 NA 1
2 2 2 NA
3 3 3 3
4 4 4 4
Я попытался это с небольшой пример данных, и она работала, но она не работает для набора данных с 2000+ строк и 7 столбцов. –
На самом деле это может иметь отношение к числу, которое я пытаюсь заменить. Фактические данные варьируются от 1 до 4 с моими отсутствующими значениями, введенными как 5. Функция «summary» просто говорит, что max равен 5. Когда я делаю это, чтобы заменить 99, он работает. –
На самом деле, возможно, последняя мысль. Будет ли «защищенная точка зрения» вызвать проблемы с этим? Файлы были загружены из Интернета, и я не открыл их в excel. Я думал, что это будет исключительно удачей, но когда я открыл файлы и сохранил их, это сработало. –