Я только что обновил свою версию Quanteda, и я получаю сообщение об ошибке, которого я не знал раньше.Ошибка «duplicate row.names» с corpus() в Quanteda
spec_txt <- textfile("spec/Spectator_Texts_purged_R.csv", textField = "Cleaned.Text")
spec_corp <- corpus(spec_txt)
возвращается:
Ошибка в data.frame (тексты = х, row.names = имена (х), check.rows = TRUE,: дублирующие row.names: Spectator_Texts_purged_R.csv
Я искал для подвешивания запятые в CSV, и даже обрезать файл до трех строк:
Issue,Signed,Text,Printer
1,C,"This is test",A
2,R,"Test this is",B
А:
Text
"This is test"
"Test this is"
ошибка сохраняется - я что-то отсутствует?
Полезно знать, извините за ошибку. В будущем этот вопрос/вопрос лучше размещен на https://github.com/kbenoit/quanteda/issues, чем на SO. –
Cheers, Ken - если честно, я никогда не уверен, когда что-то является ошибкой или моим собственным невежеством. Думаю, в этом случае это было немного. –