2009-09-05 3 views
0

Мне нужно извлечь все теги из HTML-файла. Таким образом, я получаю либо массив, содержащий значение key = для каждого из атрибутов, либо, по крайней мере, необработанный текст, составляющий тег.Как извлечь <input> теги из и (X) HTML-вход в PHP?

Я не совсем лажу с регулярным выражением, а тем более на PHP, поэтому я бы очень признателен за помощь в этом.

PD: Некоторые из тегов могут охватывать несколько строк и иметь отступы с вкладками и пробелами на последующих строках.

Спасибо.

ответ

1

Вы можете использовать DOM functions для анализа XML/XHTML-документа в дереве DOM. Оттуда вам не слишком сложно перемещаться по узлам, которые вы хотите, извлекая нужные данные.

Некоторые люди предпочитают SimpleXML functions, которые могут работать одинаково хорошо для вас. Я лично имею проблемы с SimpleXML и предпочитаю более подробные, но более мощные функции DOM.

1

Да, его легко. Используйте DOM-функцию PHP и попытайтесь найти узлы с XPath. Это должен быть безболезненный путь.