2016-05-26 2 views
0

Я спасаю в CSV-файл препроцессированный файл с пандами to_csv() функцию следующим образом:Как удалить и добавить новый список столбцов в CSV-файл?

return df.to_csv(output_file, sep = '|') 

Выходной файл .csv выглядит следующим образом:

|id|content|content2 
0|id1|some content|some content 
1|id1|some content|some content 
.... 
n|idn|more content|even more content 

Как вы можете видеть из над pandas objetct, столбцы плохо сформированы:

|id|content|content2 

Как удалить вышеуказанные столбцы и заменить t Кромка для этого новых столбцов, устанавливающих:

id|content|content2 

Других слов:

id|content|content2 
id1|some content|some content 
id1|some content|some content 
.... 
idn|more content|even more content 

Я все готовы попытались с:

df = pd.read_csv(output_file, sep='|', index_col=1)[['id','content', 'content2']] 

ответ

2

Похоже, вы просто хотите удалить индекс из выход

df.to_csv(output_file, sep = '|', index=False) 
+0

Спасибо за помощь !. Есть ли способ удалить индекс перед использованием функции 'to_csv', чтобы добавить новый заголовок в последний файл .csv? –

+1

'DataFrame' всегда имеет индекс, так что не получив его, вы можете либо заменить его другим столбцом (например, 'df.index == df ['some_column']'), либо просто получить значения 'DataFrame' с' df.values', который возвращает массив Numpy значений 'DataFrame'. –

+0

Спасибо, вы могли бы привести пример? –