Я читаю IEEEXplore для некоторых данных PDF, плитки и ссылок.Странный код HTML при очистке IEEEXPLORE
Так недавно, когда я выскабливание этого сайта (с Python и модулем саржи) я получаю это похож содержание:
��7���j��/�5�,X��]����O�s˟�����U|]�l
��c��qLE�[����:yg�u%��_�9e�;�4��^�kt)j�Te���:OX���[��u����B���-]?t�C���m/��ά��Ҋ��n�'��}'�Ù�ف{�S;�ƣ������3�dS��M[m
Так почему это происходит! Я сомневаюсь в кодировке страницы.!
код большой, но я вставил одну часть тех здесь:
вы можете увидеть код здесь:
https://github.com/power-electro/test-ieeexplore-scraper/blob/master/ieeexplore_ieee_org.py
Так Free PDF файлы из Elsevier версии этого сайта, является доступны по этой ссылке:
Что такое ссылка и где ваш код? –