Так что я загружаю некоторый удаленный контент и вам нужно использовать регулярное выражение, чтобы изолировать содержимое некоторых тегов.Использование регулярного выражения в классическом ASP для получения содержимого определенных элементов
set xmlhttp = CreateObject("MSXML2.ServerXMLHTTP")
xmlhttp.open "GET", url, false
xmlhttp.setRequestHeader "Content-Type", "application/x-www-form-urlencoded"
xmlhttp.setRequestHeader "Accept-Language", "en-us"
xmlhttp.send "x=hello"
status = xmlhttp.status
if err.number <> 0 or status <> 200 then
if status = 404 then
Response.Write "[EFERROR]Page does not exist (404)."
elseif status >= 401 and status < 402 then
Response.Write "[EFERROR]Access denied (401)."
elseif status >= 500 and status <= 600 then
Response.Write "[EFERROR]500 Internal Server Error on remote site."
else
Response.write "[EFERROR]Server is down or does not exist."
end if
else
data = xmlhttp.responseText
мне в принципе нужно, чтобы получить содержание <title>Here is the title</title>
также мета-описания, ключевые слова и некоторые выбранные Open Graph мета-данные.
И, наконец, мне нужно, чтобы получить содержание первого<h1>Heading</h1>
и <p>Paragraph</p>
Как я могу разобрать данные HTML, чтобы получить эти вещи? Должен ли я использовать регулярное выражение?
Вы считали, что вместо этого используете синтаксический анализатор xml? –
Могу ли я просто указать возвращаемое содержимое как XML и использовать выбор узла? не могли бы вы рассказать о том, как это может работать? Благодаря @ DanielA.White –