Немного тайны. У меня есть .tsv-файл, содержащий 58936 строк. Я загрузил файл в R, используя следующую команду:R read.csv не загружал все строки .tsv-файла
dat <- read.csv("weekly_devdata.tsv", header=FALSE, stringsAsFactors=TRUE, sep="\t")
но nrow (Даты) показывает только это:
> nrow(dat)
[1] 28485
Таким образом, я использовал SED -n команды, чтобы написать строки вокруг, где она остановилась (до, включая и после этой строки) в новый файл и смог загрузить этот файл в R, поэтому я не думаю, что в файле было повреждение.
Это проблема с окружающей средой?
Вот мой sessionInfo()
> sessionInfo()
R version 3.1.2 (2014-10-31)
Platform: x86_64-apple-darwin13.4.0 (64-bit)
locale:
[1] en_US.UTF-8/en_US.UTF-8/en_US.UTF-8/C/en_US.UTF-8/en_US.UTF-8
attached base packages:
[1] tcltk stats graphics grDevices utils datasets methods base
other attached packages:
[1] sqldf_0.4-10 RSQLite_1.0.0 DBI_0.3.1 gsubfn_0.6-6 proto_0.3-10 scales_0.2.4 plotrix_3.5-11
[8] reshape2_1.4.1 dplyr_0.4.1
loaded via a namespace (and not attached):
[1] assertthat_0.1 chron_2.3-45 colorspace_1.2-4 lazyeval_0.1.10 magrittr_1.5 munsell_0.4.2
[7] parallel_3.1.2 plyr_1.8.1 Rcpp_0.11.4 rpart_4.1-8 stringr_0.6.2 tools_3.1.2
ли я запустить из памяти? Неужели это не закончило загрузку?
Hi Майк: Я собираюсь попробовать это сейчас. Но так как я смог прочитать строки вокруг и включая эту строку, я не уверен, что это так. Спасибо – Jazzmine
Я уверен, что недостающие котировки являются частью проблемы.Обычно это так, когда столько строк отсутствуют. Но, может быть, и не ... –
Хорошо, я сделал предположение, что он считывает первое число x строк, но, возможно, некоторые просто не загружаются, и он дошел до конца файла. Но отклонил некоторые строки. Есть ли способ сказать это? – Jazzmine