2016-08-31 2 views
1

Я только что обновил свою версию Quanteda, и я получаю сообщение об ошибке, которого я не знал раньше.Ошибка «duplicate row.names» с corpus() в Quanteda

spec_txt <- textfile("spec/Spectator_Texts_purged_R.csv", textField = "Cleaned.Text") 
spec_corp <- corpus(spec_txt) 

возвращается:

Ошибка в data.frame (тексты = х, row.names = имена (х), check.rows = TRUE,: дублирующие row.names: Spectator_Texts_purged_R.csv

Я искал для подвешивания запятые в CSV, и даже обрезать файл до трех строк:

Issue,Signed,Text,Printer 
1,C,"This is test",A 
2,R,"Test this is",B 

А:

Text 
"This is test" 
"Test this is" 

ошибка сохраняется - я что-то отсутствует?

ответ

0

Я ошибочно обновил quantedaData и не quanteda. Модифицированные кванты и ошибка исчезла.

+0

Полезно знать, извините за ошибку. В будущем этот вопрос/вопрос лучше размещен на https://github.com/kbenoit/quanteda/issues, чем на SO. –

+1

Cheers, Ken - если честно, я никогда не уверен, когда что-то является ошибкой или моим собственным невежеством. Думаю, в этом случае это было немного. –