Я реализовал модуль python, который сбрасывает два торрент-сайта, используя python scrapy. В настоящее время он хранит данные торрента в БД и имеет возможность загружать торрент-файл, вызывая скрипт bash, который загружает файлы .torrent.Каков наилучший способ найти IP-адреса сеялок/пэров для данного файла торрента
Для исследовательских целей в БД визуализации Я хотел бы знать, если это возможно, и если да, то как получить IP-адрес из seeders
и peers
конкретного торрента. Я хотел бы создать визуализацию, чтобы увидеть корреляции между торрент-файлами, их типами (фильмы, iso-изображения, книги, ..etc) в те места, которые они засеяли/сверстники.
Например, вот что находится внутри одной из .torrent файлов я Царапины: (только часть)
d8:announce38:udp://tracker.publicbt.com:80/announce13:announce-listll38:udp://tracker.publicbt.com:80/announceel44:udp://tracker.openbittorrent.com:80/announceel35:udp://tracker.istole.it:80/announceel36:udp://open.demonii.com:1337/announceee7:comment61:Torrent downloaded from torrent cache at http://torcache.net/10:created by15:BitTorrent/782013:creation datei1384198882e8:encoding5:UTF-84:infod5:filesld6:lengthi25485e4:pathl69:Physics of Quantum Mechanics, The - Skinner, David, Binney, James.jpgeed6:lengthi1254e4:pathl69:Physics of Quantum Mechanics, The - Skinner, David, Binney, James.opfeed6:lengthi4609366e4:pathl69:Physics of Quantum Mechanics, The - Skinner, David, Binney, James.pdfeee4:name52:The Physics of Quantum Mechanics- Oxford, 2013 [PDF]12:piece lengthi16384e6:pieces5660:³é^G^W^H<83>æZèÖunB2ä<82>ªb<96>".ËWvÓo^?.F´<8e>ÍZQQÕ¬8Þ+þXS<91>-S^O9<91>¸<9f>Ê'<97>3ÎpÕöC^CNÞÔ»^F3HJ,=Àòà¶,<81><ö<84><8a>ÃÀdÔ,^SýZ<8f>!Q"r¹<98>³Agì=ûr"ged<96>½<89>à ¥E'Å^V|ïª{^M<88><9c>»z½/qsø<^8^@í¤Ô[_<83><9e><97>Éãs^V×»Ö\Ûë"^NÝó<9e>¬^Kbì«õ<98>²<82>^\_PÍFª^_µ^L<9b>^Vâ^NhÛ<87>[email protected]ê\íäÎ/³<8c>^]jÀóp<87>¬ <87><8e>,?<8d>&^^®Rê±ÃFÏÂ&Ü]!ö<87><zü{SîÖg.I±Ã^QÃ~Ê>uÛÜä^Cw^_d_r0<8a>h<81><9b>êªEÇa^N¢M4Èv^_<96>lË,g^Fò«^]¿<9c><88>p^[Ñ.ìk©t
я смогу использовать эту информацию в файл для подключения к трекеру и двигаться вперед, чтобы найти сверстников и сеялок для этого файла?
Думаю, вопрос теперь будет, все ли файлы .torrent подчиняются той же спецификации? Должен ли я иметь разные парсеры для разных файлов .torrent, загруженных с разных сайтов? –
Учитывая, что BitTorrent не является официальной спецификацией, все возможно. Если вы найдете что-то, что не соответствует этой спецификации, вам придется исследовать это самостоятельно. –
Я нашел библиотеку https://pypi.python.org/pypi/BitTorrent-bencode и использовал ее для анализа файла торрента и получения хэша анонса, списка и информации. Должен ли я относиться к URL-адресам специально, так как у них есть 'udp: //' они используют протокол UDP –