У меня есть. CSV-файл для импорта в R, который имеет более 1K наблюдений. Однако, когда я использовал функцию read.csv, как обычно, импортированный файл имеет только 21 наблюдение. Это странно. Я никогда не видел этого раньше.Потеря данных во время чтения.csv в R
t <- read.csv("E:\\AH1_09182014.CSV",header=T, colClasses=c(rep("character",3),rep("numeric",22)),na.string=c("null","NaN",""),stringsAsFactors=FALSE)
Может ли кто-нибудь помочь мне разобраться в проблеме? Я даю ссылку на мой файл данных:
https://drive.google.com/file/d/0B86_a8ltyoL3TzBza0x1VTd2OTQ/edit?usp=sharing
Посмотрите на строку 22 - есть ли что-нибудь странное? – A5C1D2H2I1M1N2O1R2T1
@AnandaMahto Кажется, в строке 22 есть беспорядочное значение ... Не может ли R просто принудить это к значению NA? – Vicki1227
Похоже, что в файле много других строк, которые также вызовут проблемы. Вы можете использовать 'fread' в пакете' data.table' для чтения во всем файле. Все столбцы будут принуждаться к символу из-за нечисловых значений, разбросанных по столбцам с 4 по 25, но у вас будет как минимум весь файл, и вы можете просто вручную очистить его соответственно оттуда. – nrussell