2013-02-24 5 views
1

Я ищу решение для случайного отбора репозиториев из Github. Конечным результатом является выполнение некоторого анализа данных по выборке.Случайный выбор хранилищ Github

Что я хотел бы сделать, это образец по идентификатору репозитория: образец int между 0 и 2,7 миллионами и найти связанное репо. После того, как у меня будет имя пользователя/repo-name, я буду использовать api для получения информации.

Проблема в том, что я не знаю, как искать по идентификатору repo. Какие-либо предложения? Я открыт для веб-скинов или решений Python.

+0

не конечно, если это помогает, но вы можете получить доступ к пользователю по идентификатору int через остальную часть api.Тогда вы можете получить доступ к любому репозиторию этого случайного пользователя. – three

ответ

1

Вы можете использовать python для доступа к GitHUb V3 Api (как в «Most suitable python library for Github API v3»).

И вы можете access GitHub repos от определенного идентификатора (GET /repositories, с в качестве параметра, целочисленных ID последнего Repository, что вы уже видели:., Так что может обеспечить обходной путь для доступа к репо с их идентификатором

+0

Я не понимаю вас решение, не возражаете ли вы расширить его еще? В частности, что делает " последний репозиторий, который вы видели? » –

+0

@ Cam.Davidson.Pilon Это означает, что он перечислит все репозитории, начиная с определенного идентификатора. В вашем случае вы можете выбрать только первый вариант, чтобы получить доступ к репо за его id – VonC

+0

Так, например, https: //api.gith ub.com/repositories?ID=50000 должны возвращать идентификаторы> = 50000. Но (по крайней мере для меня) этот URL не делает этого. –