Ошибка «duplicate row.names» с corpus() в Quanteda

Я только что обновил свою версию Quanteda, и я получаю сообщение об ошибке, которого я не знал раньше.Ошибка «duplicate row.names» с corpus() в Quanteda

spec_txt <- textfile("spec/Spectator_Texts_purged_R.csv", textField = "Cleaned.Text") 
spec_corp <- corpus(spec_txt)

возвращается:

Ошибка в data.frame (тексты = х, row.names = имена (х), check.rows = TRUE,: дублирующие row.names: Spectator_Texts_purged_R.csv

Я искал для подвешивания запятые в CSV, и даже обрезать файл до трех строк:

Issue,Signed,Text,Printer 
1,C,"This is test",A 
2,R,"Test this is",B

А:

Text 
"This is test" 
"Test this is"

ошибка сохраняется - я что-то отсутствует?

источник

2016-08-31 Mark Hill

Я ошибочно обновил quantedaData и не quanteda. Модифицированные кванты и ошибка исчезла.

источник

2016-08-31 13:38:51

Полезно знать, извините за ошибку. В будущем этот вопрос/вопрос лучше размещен на https://github.com/kbenoit/quanteda/issues, чем на SO. –

Cheers, Ken - если честно, я никогда не уверен, когда что-то является ошибкой или моим собственным невежеством. Думаю, в этом случае это было немного. –

Ошибка «duplicate row.names» с corpus() в Quanteda

ответ

Смежные вопросы