2014-01-17 1 views
0

Мне нужно обработать данные из файла csv таким образом, чтобы вывод должен печатать три столбца, например. c1, c2 и c3, где c1 и c2 должны использовать предложение group by, как в mysql, а c3 - это сумма двух других столбцов.Агрегация данных из CSV-файла с использованием Pandas python

Я новичок в python, идеи действительно помогут мне.

ответ

0

Я немного сделал это на C#. Сначала вы открываете файл и начинаете читать строки текста. Первая строка в .csv должна быть столбцом заголовка, поэтому обрабатывайте ее отдельно. Следующие строки должны быть вашими данными.

Теперь, когда у вас есть текст, вставьте его в строку, а затем разделите запятыми. Это даст вам строковый массив. Затем создайте массив int, преобразуя строки в текст. Это не должно быть проблемой, поскольку все данные в столбце являются целыми числами. Если нет, проверьте нецелые значения и преобразуйте их в строки, которые являются действительными. НАПРИМЕР. if array [0] == "no data" array [0] = "0" или array [0] = null. Затем создайте столбец 3, добавив целочисленные значения для первого и второго столбцов вместе.