2010-05-30 2 views
5

Я хочу перестроить любую веб-страницу в логическое представление страницы. Например, если на веб-странице есть меню, то я хочу, чтобы структура логического меню, возможно, была в XML. Если на веб-странице есть статья, я хочу узел XML статьи, если у него есть заголовок для статьи, я хочу узел XML заголовка. В принципе, я хочу логическую форму веб-страницы без какого-либо пользовательского интерфейса.Обратный инженер a веб-страница

Эта логическая модель может быть объектами в коде или XML, это не имеет значения, важная часть состоит в том, что она определила, что все на странице означает.

ответ

3

Похоже, что вы хотите, чтобы человек классифицировал содержимое страницы.

Это может быть автоматизировано, однако оно будет иметь ложные срабатывания и не работать в каждом случае.

Например, что, если одна страница использовала ul для меню и еще одну ячейку таблицы?

Вы хотите, чтобы это было для одного сайта в частности или любого сайта в Интернете?

0

Как насчет разбора XML уже на странице, см

http://en.wikipedia.org/wiki/XHTML

+3

Я собирался тоже предположить, что он преобразует весь Интернет в XHTML;) – Onots

+0

заставляет меня хотеть, чтобы найти, что GIF в ОС Windows передайте диалог «Загрузка Интернета ...» – alex

+2

@alex - http://www.gifbin.com/982378 :) Хотя размер кажется немного небольшим сейчас .... –

 Смежные вопросы

  • Нет связанных вопросов^_^