2014-09-17 1 views
0

Вот мой pdf enter image description here Я нашел THIS, и я использовал его, чтобы отказаться от моего pdf-файла.Как читать по строкам в pdf-файле и создавать CSV

6 BEDROOMS 
NameAddressUnitSizeKeyRentSq FtMove in DateNotesTenant 
Prop # 
Texan 261009 West 26th3076x3$4,6952,1368/15/14$1,000 Bonus (1) Park -  

Его довольно смешанный. или Is, потому что PDF отформатирован таким образом, который нечитабелен? Я думал, что есть способ, которым я мог бы ломать каждую строку и создавать CSV с колонками по итерации или что-то в этом роде.

Как заполнить CSV с колоннами

T26 | Texan 26   | 1009 West 26th | 307  | 6x3 | ... 
e075| Texan North Campus| 5117 N Lamar |See below | 6x3 |... 

Есть ли способ обойти это?

+0

Не могли бы вы предоставить документ в формате PDF? – sherwoor

ответ

0

Фрагмент кода, который вы использовали, предоставил некоторые практически неиспользуемые данные, я не думаю, что это путь. Скребок из PDF, как правило, довольно сложный, однако посмотрите на pdftables.com: они предоставляют API для соскабливания таблиц из документов PDF, которые, как я нашел, работают в большинстве случаев - это ваш лучший шанс на это, я бы сказал ,

+0

Да, я вижу, что pdftables.com работает, но я хотел создать сценарий для этого. – Alexxio

+0

У них есть API, который вы можете включить в свой скрипт. – sherwoor

 Смежные вопросы

  • Нет связанных вопросов^_^