Кто-нибудь знает о возможности программной загрузки изображений из Викисклада без регистрации на учетную запись Bot? Кажется, единственный способ получить разрешение на учетную запись Bot - это добавить или изменить информацию уже на Wikimedia. Если вы пытаетесь загрузить любые изображения, без учетной записи бота, используя некоторые из библиотек api, вы получаете сообщения об ошибках вместо изображений. Похоже, они блокируют всех, кто не приходит из браузера? У кого-нибудь еще есть опыт? Я что-то упустил?Загрузка изображений из Wikimedia Commons
ответ
Попробуйте объяснить, что именно вы хотите сделать? И что вы пробовали? Какое сообщение об ошибке вы получили? Вы еще не поняли ...
Какие библиотеки вы пытались? Если вы не агрессивны, нет никаких ограничений при загрузке WM-контента. Я никогда не слышал никаких ограничений. Некоторые пользовательские агенты запрещены для редактирования, чтобы избежать глупого спама, но на самом деле я никогда не слышал об ограничениях на скачивание.
Если вы пытаетесь очистить огромное количество изображений, загрузив их через Commons, вы делаете это неправильно (tm). Если вы пытаетесь получить несколько изображений в любом месте от 10 до 200, вы должны иметь возможность написать достойный инструмент в нескольких строках кода при условии, что вы соблюдаете требование дросселирования: когда API говорит вам замедлить работу, если вы этого не сделаете, сидэдмины, скорее всего, вышвырнут вас.
Если вам нужен полный дамп изображения (мы говорим о нескольких ТБ), попробуйте задать wikitech-l. У нас были торренты, когда было меньше изображений, теперь это сложнее, но все же doable.
О бот счетах. Насколько глубоко вы выглядели в системе? Вам нужна бот-аккаунт для быстрых, неконтролируемых изменений. В привилегиях Бот также есть несколько возможностей, таких как увеличение размеров запросов. Но помните: бот-аккаунт? это просто расширенная учетная запись пользователя. Вы пытались запустить что-либо с классической учетной записью?
Только что сделал это сам я чувствую, что я должен поделиться:
http://www.mediawiki.org/wiki/API:Allimages
Этот API документ не утверждают, что вы можете запросить изображения:
с aiprop = URL вам предоставляется URL-адрес изображения, которое вы ищете.
Спасибо! Этот: http://www.mediawiki.org/wiki/API:Categorymembers также полезен. – Hypercube
Не действительно найти ответ я ищу .. но эта страница интересно :: http://www.makeuseof.com/tag/4-free-tools-for-taking-wikipedia-offline/
Особенно # 4 .. но мне кажется, страница вниз .. проект мертв?
Обратите внимание, что когда-либо возникала проблема с использованием LWP: это нелогично, это практично, агенты могут создавать массивные нагрузки на уже растянутые серверы. Существуют разумные стратегии, которые могут выполнять агенты-пользователи, чтобы уменьшить нагрузку - спросите на www.mediawiki.org или en: Деревенский насос - Технический
Если вам нужно от десяти до одного миллиона файлов, используя инструменты Magnus Manske для повторной обработки категорий это хороший выбор. http://tools.wmflabs.org/magnustools/can_i_haz_files.html создает список команд UNIX, которые затем можно запускать локально.
Спасибо, это полезно. У меня есть сайт о растениях, и я хотел бы включить некоторые фотографии из WikiMedia Commons. Я выполнил запрос против http://toolserver.org/~daniel/WikiSense/CategoryIntersect.php, чтобы получить список изображений в определенной категории, а затем запустить другой запрос против http://toolserver.org/~magnus/commonsapi.php, чтобы получить метаданные о каждом изображении. Затем я использовал urllib.urlretrieve в скрипте python для получения фактического изображения. Tho Я просто попробовал это снова, и он работает, так же как и wget. Хммм, у меня, возможно, была ошибка с формированием URL-адреса. – tomvon
Я не ищу полную свалку, всего несколько фото. Я также хотел бы создать плагин Wordpress, который позволит вам искать WC и добавлять более легкие изображения на ваш сайт (с надлежащей атрибуцией). Вы знаете, где есть информация о ограничениях дросселирования? Я сделал довольно подробное чтение в WC, но не помню ничего о ограничениях. Я, конечно, хочу уважать Условия использования. – tomvon
См. Http://www.mediawiki.org/wiki/Manual:Maxlag_parameter для дросселирования. Обратите внимание, что это рекомендация, поэтому, если вы никогда не видели ошибки «maxlag» или блокировки/блокировки/блокировки с ошибками, вы, вероятно, никогда не были дросселированы или заблокированы. – NicDumZ