2017-01-17 19 views
1

На моей работе мы работаем с огромным набором данных о свойствах недвижимости, сжатых в csv-файле объемом около 200000 строк (постоянно растет).Создание листа данных Excel из большого файла csv с использованием python (или другого)

Этот CSV лист содержит столбцы с информацией, такие как: ценообразование, площадь поверхности, год постройки, улица Н.Р., почтовый индекс и т.д.

Часть работы, которую мы делаем включает в себя создание листа Excel свойств которые сопоставимы с объектом в пределах определенного предела (например, площадь поверхности +/- 20%).

Я хочу автоматизировать создание такого списка Excel, и я думал об использовании Python для этого. Вот что я хочу, чтобы программа, чтобы сделать:

1) Прочитайте в CSV файл

2) принимает все необходимые параметры для сравнения на листе Excel

3) Создать лист первенствовать из данные csv со свойствами, которые соответствуют этим параметрам

4) Перепишите описания абстрактных параметров (например, если значение «посудомоечная машина» столбца «0», напишите «Нет посудомоечной машины») и добавьте значение в столбец house_number на значение столбца street_name

Является ли python хорошим способом для этого или у вас есть другие предложения?

+0

Excel может импортировать данные CSV. Нет необходимости конвертировать данные из CSV. – Olian04

ответ

0

Python - хороший язык для синтаксического анализа данных. Использование библиотеки pandas может оказаться полезным. Он имеет функции для импорта CSV и функций для работы с результирующими данными. Панды также могут напрямую экспортироваться в excel format.

+0

Извините за поздний ответ и большое спасибо. Я посмотрю. –