2016-06-01 6 views
2

Я скриншотов с кучей веб-страниц, используя Python с Selenium. Я хочу сохранить PNG локально для справки. Список URL-адресов выглядит примерно так:Разумный способ создания имен файлов для файлов на основе URL-адресов?

www.mysite.com/dir1/pageA 
www.mysite.com/dir1/pageB 

Мой вопрос о том, что имена файлов, чтобы дать screenshotted PNGs.

Если я вызываю файлы изображений, например. www.mysite.com/dir1/pageA.png бессмысленные косые черты неизбежно вызовут проблемы в какой-то момент.

Я могу заменить все символы / в URL-адресе _, но я подозреваю, что это может вызвать проблемы, например. если в URL уже есть _ символов. (Мне не нужно уметь работать назад от имени файла до URL-адреса, но это было бы неплохо.)

Что такое разумный способ обработки имен?

ответ

0

Что делать, если вы используете «% 2F»? Это кодировка '/', но html.

источник: http://www.w3schools.com/tags/ref_urlencode.asp

+0

В общем случае '%' является проблематичным символом для использования в имени файла. См. Http://stackoverflow.com/questions/4814040/allowed-characters-in-filename для полного обсуждения. –

1

Самый простой способ представить, что это почти наверняка структура каталогов на сервере, чтобы сделать, как wget делает и повторить эту структуру на локальном компьютере.

Таким образом / персонажи становятся каталог разделителей, и ваш www.mysite.com/dir1/pageA.png станет файл PNG под названием pageA.png в директории под названием dir1 и dir1 находится в директории под названием www.mysite.com.

Это просто, гарантировано, что оно обратимо и не подвержено неоднозначным результатам.

 Смежные вопросы

  • Нет связанных вопросов^_^