Я пытаюсь захватить/извлечь текст из другого URL-адреса с помощью cURL. Местоположение, где я беру текст, находится в пределах чистого документа HTML с динамическими (не статическими) данными, поэтому для фильтрации не существует HTML-тегов. Это то, что я получил до сих пор:Как использовать cURL для извлечения текста
$c = curl_init('http://url.com/dataid='.$_POST['username']);
curl_setopt(CURLOPT_RETURNTRANSFER, true);
curl_setopt(CURLOPT_FRESH_CONNECT, true);
$html = curl_exec($c);
if (curl_error($c))
die(curl_error($c));
// Get the status code
$status = curl_getinfo($c, CURLINFO_HTTP_CODE);
curl_close($c);
Это прекрасно работает, однако в конце динамического HTML документа есть не-искомый текст, «#endofscript» (без кавычек). Это схватывается/выбирается, так что можно сделать, чтобы не схватить это? Я пробовал смотреть на «strpos» и такие, но я не уверен, как интегрировать это с cURL.
Все/Любая помощь будет/будет оценена. :)
EDIT: Код настоящее время я использую:
<?php
$homepage = file_get_contents('http://stackoverflow.com/');
$result = substr("$homepage", 0, -12);
echo $result;
?>
Вы уверены, что проблема не существует в пределах cURL? Для меня это выглядит так: «#endofscript» - это результат вывода скрипта, который генерирует/отправляет текст, который вы извлекаете. – Poni
Попробуйте выбрать не динамический текст/страницу, и если будет написан текст «#endofscript», то это будет cURL, кто его вызывает, иначе вы должны изучить другую сторону (скрипт сервера). – Poni
Привет, Да, вы правы. Текст «#endofscript» находится в динамическом HTML-документе и не связан с скриптом cURL. Сценарий cURL просто подбирает текст «#endofscript» и отображает его на моей веб-странице. Я спрашиваю, есть ли там, чтобы не схватить это? С уважением, и я ценю ваш ответ.:) – AUllah1