2015-02-07 2 views
-2

Я импортирую вики-страницы на основе их страницы (или URL-адреса).Как определить, являются ли 2 страницы одной и той же темы, но на разных языках?

Возможно, я импортировал страницу, и я сохранил, в частности, ее язык (например, EN).

Если я должен импортировать переведенную страницу вышеуказанной версии EN, получив только новый pageid (или url), как я могу связать их между собой, чтобы сохранить их в своей базе данных под тем же именем темы (но с двумя разными языками)?

Использование API MediaWiki, конечно же.

ответ

0

Вы можете проверить, подключены ли они langlinks. Например, страница Einstein для langlinks: По названию: https://en.wikipedia.org/w/api.php?action=query&titles=Albert%20Einstein&prop=langlinks На странице: https://en.wikipedia.org/w/api.php?action=query&pageids=736&prop=langlinks Но следует помнить, что разные языковые страницы не являются переводом, содержание может отличаться от одного и того же предмета, это не прямые переводы en.wikipedia ,