Я использую API MediaWiki для получения первого абзаца некоторых статей в Википедии. В настоящее время проблема, с которой я сталкиваюсь, - это условия, которые содержат несколько записей в Википедии. Например, термин Java приводит статью Википедии для острова Java, а не язык программирования. Есть ли какой-то параметр, который я должен использовать для разграничения между ними?Как получить правильную статью в Википедии
1
A
ответ
-2
проверка http://en.wikipedia.org/w/api.php для:
* list=querypage (qp)
Parameters:
qppage - The name of the special page. Note, this is case sensitive
This parameter is required
One value: Ancientpages, BrokenRedirects, Deadendpages, Disambiguations, DoubleRedirects, Listredirects,
Lonelypages, Longpages, Mostcategories, Mostimages, Mostinterwikis, Mostlinkedcategories,
Mostlinkedtemplates, Mostlinked, Mostrevisions, Fewestrevisions, Shortpages,
Uncategorizedcategories, Uncategorizedpages, Uncategorizedimages, Uncategorizedtemplates,
Unusedcategories, Unusedimages, Wantedcategories, Wantedfiles, Wantedpages, Wantedtemplates,
Unwatchedpages, Unusedtemplates, Withoutinterwiki
Я думаю Mostrevisions, Mostlinked и Mostcategories может помочь вам получить значимую страницу.
вот пример по использованию: http://en.wikipedia.org/w/api.php?action=query&list=querypage&qppage=Ancientpages
1
Проверьте категории. Статья «Java» относится к «Островам Большого Зонды», а статья «Java (язык программирования)» относится к «семейству языков программирования C», «Языки программирования на основе классов», «Языки параллельного программирования» и т. Д.
Теперь термин «Java» * * относится к обоим темам. По какому критерию вы хотите дифференцировать? Знаете ли вы, что ищете язык программирования или что? – Bergi
По сути, я хотел бы знать, есть ли параметр, который позволит мне указать, к какому термину я имею в виду. Возможно, есть параметр категории, который позволит мне сделать это, что я сейчас просматриваю. Тем не менее, для этого конкретного примера я хотел бы получить Java язык. – user2155400
Да, есть параметр 'incategory:'; поэтому, если вы знаете это название категории, вы можете это использовать. – Bergi