2009-11-29 3 views
0

Я занимаюсь разработкой приложения, которое извлекает различные входы с интернет-страниц, тогда как каждый фрагмент информации поступает из другого места (mashup). Я хотел бы сгенерировать строительный блок mashup (фрагменты) с помощью визуального инструмента. Знаете ли вы что-нибудь подобное, что можно использовать для такого проекта? (Уже сделанный контроль, образец кода, статья и т. Д.) Предпочитаемая среда разработки - .NET, но не обязательно.Как визуально спроектировать mashup-запрос для программной экстракции

+0

"snipest" означает "snippet"? –

+0

Да - это то, что я имел в виду – Galco

ответ

0

IMO Основная проблема заключается в извлечении соответствующей информации из каждого фида в семантической форме. Википедия описывает коллажи как:

Есть много типов коллажей, такие как потребительские коллажей, коллажи данных и предприятия коллажей. Наиболее распространенным типом mashup является потребительский mashup, , предназначенный для широкой публики.

Данные mashups объединяют аналогичные типы СМИ и информацию от нескольких источников в одно представление. Одним из примеров является AlertMap, который объединяет данные из более чем 200 источников , связанных с суровыми погодными условиями, биологически опасных угроз и сейсмической информации, и отображает их на карте мира; другой - Чикаго Преступная карта, которая указывает на преступление тариф и местонахождение преступления в Чикаго.

Классический mashup - преступление в Чикаго - работает, поскольку ключевая информация, такая как даты и геолокации, доступна семантически. Другими типами общей информации являются лица, организации и идентификаторы домена.

Когда вы определили их, вы можете рассмотреть инструменты на основе RDF, которые разрабатывает семантическая сеть. Обратите внимание, что правительства начинают выдавать свои данные в RDF, поэтому я бы рассматривал это как ключевую технологию.

Если ваши веб-страницы не имеют семантической информации, вам, вероятно, придется создавать скребки экрана и парсеры HTML. Это не очень гламурно, нет специальных инструментов и, как правило, просто тяжелая работа.