Я пытаюсь прочитать seeds dataset с помощью панд. При загрузке файла с помощью:Запутать ошибку read_table в pandas
df = pd.read_table("seeds_dataset.txt", header=None)
я получаю:
CParserError: Error tokenizing data. C error: Expected 8 fields in line 8, saw 10
Теперь для загрузки файла с Excel, мне нужно указать вкладку и пространство в качестве разделителей в то же время, чтобы правильно читать файл на этой строке 8, что нельзя сделать с помощью панд (насколько я знаю). Sublime Text читает файл точно.
Я не хочу пропускать плохие строки с error_bad_lines
, поскольку с ними нет ничего плохого. Я также использовал lineterminator
без успеха.
Спасибо за ответ, не могли бы вы объяснить больше, почему работает 'delim_whitespace'? Мне больше интересно узнать о происхождении проблемы – Valilutzik