Я пишу скрипт python, который будет извлекать URL-адрес видео в facebook. Но в источнике видеостраницы я вижу некоторые символы формы \ uxxxxxx в URL-адресе.конвертировать Юникод формы " uxxxxxx" в строку или текст
, например, URL-адрес в этой форме
https\u00253A\u00255C\u00252F\u00255C\u00252Ffbcdn-video-a.akamaihd.net\u00255C\u00252Fhvideo-ak-prn2\u00255C\u00252Fv\u00255C\u00252F753002_318048581647953_53890_n.mp4\u00253Foh\u00253D64e3e8ecf7e88f1da335d88949b2dc1f\u002526oe\u00253D52226D10\u002526__gda__\u00253D1377987338_9e37fb163a1d37d4b06ab7cff668f7dc\u002522\u00252C\u002522
\ u00253A является двоеточие (:), но как я преобразовать его.
Когда я сделал, как
>>> x.decode('unicode_escape').encode('ascii','ignore')
я получить
'https%3A%5C%2F%5C%2Ffbcdn-video-a.akamaihd.net%5C%2Fhvideo-ak-prn2%5C%2Fv%5C%2F753002_318048581647953_53890_n.mp4%3Foh%3D64e3e8ecf7e88f1da335d88949b2dc1f%26oe%3D52226D10%26__gda__%3D1377987338_9e37fb163a1d37d4b06ab7cff668f7dc%22%2C%22
Я хочу, чтобы точный адрес не в процентах.
Я много искал, но не нашел никакой помощи.
Заранее спасибо
Edit
Есть ли способ, если я прохожу весь источник facebook страницы, а затем конвертировать весь такой сложный юникод характер простой.
Это странная двойная экранированная строка. –
@mechanical не только URL, но большая часть его присутствует в javascript. Например, проверьте источник https://www.facebook.com/photo.php?v=10102527792694996. Нажмите CTRL + F и найдите «.mp4» – vaibhav1312