2013-12-19 2 views
3

URL, интерес есть:Существует ли этот URL-адрес? RCurl говорит не

http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=/netahtml/PTO/search-adv.htm&r=10&f=G&l=50&d=PTXT&OS=AN/(nortel)&RS=AN/nortel&Query=AN/(nortel)&Srch1=nortel.ASNM.&NextList1=Next 50 Hits 

Выбранная функция, чтобы проверить его существование:

> url.exists("http://patft.uspto.gov/netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=/netahtml/PTO/search-adv.htm&r=10&f=G&l=50&d=PTXT&OS=AN/(nortel)&RS=AN/nortel&Query=AN/(nortel)&Srch1=nortel.ASNM.&NextList1=Next 50 Hits") 
[1] FALSE 

Почему Дис нет работы? URL-адрес явно существует и разрешается в хроме, а использование htmlTreeParse по URL-адресу работает отлично.

+3

недействителен, поэтому я предполагаю, что, по крайней мере, пространство должно быть экранировано либо как '+', либо как '% 20', возможно, вам также придется избегать скобок, не знать наверняка. Браузеры, как правило, очень снисходительны и делают это за вас – falstro

+0

Почему htmlTreeParse работает над этим? – stanekam

+1

Не знаю, он должен был бы выполнить надлежащее экранирование внутри, чтобы он работал, он не может использоваться так, как он есть в HTTP-запросе (пространство отделяет URL-адрес от строки версии HTTP/1.1), так или иначе искажено в соответствии с URL RFC – falstro

ответ

5

Мое предположение было бы, что url.exists использует HTTP Лобовое запрос, который сервер кажется не в состоянии справиться:

$ telnet patft.uspto.gov 80 
Trying 151.207.240.26... 
Connected to patft.uspto.gov. 
Escape character is '^]'. 
HEAD /netacgi/nph-Parser?Sect1=PTO2&Sect2=HITOFF&u=/netahtml/PTO/search-adv.htm&r=10&f=G&l=50&d=PTXT&OS=AN/(nortel)&RS=AN/nortel&Query=AN/(nortel)&Srch1=nortel.ASNM.&NextList1=Next+50+Hits HTTP/1.1 
Host: patft.uspto.gov 
Connection: close 

Connection closed by foreign host. 

Так сервер сломан, не RCurl.

+1

Спасибо! Очень признателен. Во-первых, я работал над использованием функции url.exists, но я хотел узнать больше об этой новой новомодной интернет-вещи, и это дает мне несколько стартов! – stanekam

 Смежные вопросы

  • Нет связанных вопросов^_^