1

Я хочу получить данные из таблиц на веб-страницах, которые, как представляется, публикуются с использованием «Публикация публикации в виде веб-страницы». Я знаю, что есть много инструментов для скремблирования (они выглядят намного продвинутыми для такой задачи), и я знаю, что могу написать скрипт, но я хотел бы указать на что-то очень простое, особенно, что данные публикуются с использованием автоматизированного инструмент.извлечение веб-данных, получение данных из таблиц в CSV

Я предпочитаю иметь решение для рельсов.

Данные статистические данные здоровья, here are links to some samples.

ответ

0

Да, структура действительно проста. На вашем месте я бы просто использовал любой язык, который вам известен, и не трать время на изучение сторонних скребок. Лично я использую C# для таких задач.

+0

Правда, я планирую использовать рельсы, есть хороший драгоценный камень под открытым небом с приятным блогом об использовании его: http://www.igvita.com/2007/02/04/ruby-screen- scraper-in-60-seconds/ , но я думал, что такая общая структура данных будет иметь что-то готовое к использованию. Возможно, я должен задать в stat.exchange, спасибо большое. – Bahax