2015-03-02 1 views
0

Я пытаюсь сделать некоторые веб-соскоб, но у меня есть некоторые проблемы в присоединении относительно корневой и URLsприсоединения URLs с urljoin в питона

, например, корень URL является: http://www.jmlr.org/proceedings/papers/v2

и относительный URL является: ../v2/meila07a/meila07a.pdf

Как я использовать urljoin в urlparse: результат нечетно:

http://www.jmlr.org/proceedings/v2/meila07a/meila07a.pdf

Это недопустимая ссылка. Кто-нибудь может мне помочь?

ответ

0

Две точки (..) означают возврат один раз в иерархию, изменение второй ссылки на ./v2/meila07a/meila07a.pdf, и она должна работать нормально.

Или вы также можете изменить корень на http://www.jmlr.org/proceedings/papers/v2/, благодаря этому изменению он больше не будет удалять v2 в конце, потому что корень не был установлен в соответствующий каталог.