Я пытаюсь увидеть тип контента веб-URL, используя следующий код.Почему я получаю тип содержимого PDF-файла, который возвращается как HTML?
Интересно, что тип содержимого данного URL-адреса (http://www.jbssinc.com/inv_pr_pdf/2007-05-08.pdf"
) возвращается как text/html; charset=iso-8859-1
, хотя это документ PDF. Я хотел бы понять, почему.
Вот мой код:
public static void main(String[] args) throws MalformedURLException{
URLConnection urlConnection = null;
URL url = new URL("http://www.jbssinc.com/inv_pr_pdf/2007-05-08.pdf");
try {
urlConnection = url.openConnection();
urlConnection.setConnectTimeout(10*1000);
urlConnection.setReadTimeout(10*1000);
urlConnection.connect();
} catch (IOException e) {
System.out.println("Error in establishing connection.\n");
}
String contentType = "";
/* If we were able to get a connection ---> */
if (urlConnection != null) {
contentType = urlConnection.getContentType();
}
System.out.println(contentType);
}
поговорить с кем бы создать этот сайт. это не имеет никакого отношения к вашему коду. и только потому, что URL-адрес заканчивается на '.pdf', это не значит, что сайт должен действительно обрабатывать данные в формате pdf. что вполне может быть html-страницей с «пожалуйста, войдите в систему, чтобы просмотреть файл» или что-то еще. –
@dsh, кто-либо предоставляет тип контента или это то, что автоматически обнаруживается сервером? –
Я только что отправил запрос (используя Firefox) на этот URL-адрес и ответил «Content-Type: application/pdf». – dsh