Я занимаюсь анализом HTML
с использованием Jsoup
в Android, и я столкнулся с некоторыми странными вещами (для меня). Некоторые сайты работают нормально, используя простой метод Jsoup.connect(String).get()
.Jsoup userAgent на Android - Что это значит?
Но в некоторых других местах I ВСЕГДА Получите EOFException
. Поэтому я искал и решал свойство userAgent
, и когда я использую Jsoup.connect(String).userAgent("Mozilla").get()
, он работает нормально.
Теперь, что именно означает «мозилла»? Что мое приложение может работать только с устройствами, установленными Mozilla
?
Немного поисковой системы не повреждает https://en.wikipedia.org/wiki/User_agent. Каждый сайт должен решить, как он обрабатывает заголовок 'user-agent'. Он может отклонить запрос, если 'user-agent' пуст или * неизвестен * или имеет неправильный формат или ... что угодно. Он также может просто игнорировать его. – nyname00