Я соскабливаю веб-сайты для информации, и это связано с получением хэшей sha1 магнитных ссылок.Шахи 1 и их длина с протоколом бит торрент (магниты)?
Я получаю все магнитные ссылки с простым preg_match_all
, но в моих результатах я получаю странные результаты, я понимаю, что магнитный хэш в шестнадцатеричной форме имеет длину 40 символов, но я также получаю результаты, которые возвращают строки, которые 32 символа, которые содержат другие не шестнадцатеричные значения.
Два примера из моих результатов, во-первых, нормальный 40 шестнадцатеричном хэша в ссылку магнита,
array
0 => string 'F5AD2D170C033736FD987106F04C3ABD6DF41D14' (length=40)
И другие странные результаты, которые я не понимаю, где хэш является 32 не шестнадцатеричное значение,
array
0 => string 'VPR33QQM3L6BFU5FGOZXMBNORAFFSZWW' (length=32)
Был ли хэш упакован каким-то образом? Я знаю, что это не делается с pack('H*', $hash)
, так как это возвращает двоичный файл хэша? Магнитные связи работают, как я их протестировал.
Более того вы можете увидеть эти хэши в использовании на этом сайте
При наведении курсора на магнитных ссылок и глядя на магните хэш.
Благодаря
Это другая информация о магнитах, ваше регулярное выражение (это ужасный способ разобрать html-страницу) также должно захватывать информацию трекера. –
@AlexLunix Я не о другой информации, я о хэш, который находится во втором примере с длиной 32? – Griff