Мне нужно автоматически загрузить текущую версию Wall Street Journal Prime Rate и загрузить данные в мою базу данных. Каков наилучший метод для автоматической загрузки этих данных?Загрузить Current WSJ.com Prime Rate
Я придумал три возможных решения для этого делать:
- Scrape веб-страницы HTML с WSJ.
- Разбор RSS-ленты новостей от WSJ.
- Используйте API, который я не нашел в WSJ.
Что касается решения 1, хотя мне не нравится решение 1, так как он может легко сломаться, это единственный, который я разработал из конца в конец. Оказывается, я могу соскрести this page с WebRequest/WebResponse и читать текст в этом коде:
<tr>
<td style="text-align:left" class="colhead"> </td>
<td class="colhead">Latest</td>
<td class="colhead">Wk ago</td>
<td class="colhead">High</td>
<td class="colhead">Low</td>
</tr>
<tr>
<td class="text">U.S.</td>
<td style="font-weight:bold;" class="num">3.25</td>
<td class="num">3.25</td>
<td class="num">3.25</td>
<td class="num" style="border-right:0px">3.25</td>
</tr>
Что касается решения 2, хотя я могу реализовать решение RSS читатель, я не вижу способа надежно прогнозировать словоблудие для изменений в Prime Rate. Поэтому я не считаю это безопасным или надежным способом получить данные как решение 1.
Что касается решения 3, я не нашел опубликованных API для проверки денежных ставок, таких как Prime Rate. Если кто-нибудь знает веб-службу или другой API для проверки денежных ставок, пожалуйста, дайте мне знать.
Что вы используете? Прямой HTML плюс некоторые Ajax? ASP.NET? PHP? – slugster
Я запускаю задачу сценария C# в пакете SSIS, чтобы очистить целевую HTML-страницу один раз в день. Это работает, но должно быть лучшее решение, чем это, потому что я в зависимости от того, что WSJ.com не изменит их таблицу или макет страницы. –