Я хочу получить этот список, чтобы позже работать над ним для линкистических исследований.Как получить полный список названий страниц из Википедии?
API:Allpagesis limited to 500 queries. Мне нужны все они (4 миллиона).
Возможно атаковать его с помощью dbpedia.
Любой трюк для этого?
http://dumps.wikimedia.org/backup-index.html (только для личного или некоммерческого использования) – nneonneo
Первая страница содержит 500 результатов, но вы можете получить следующую, выполнив 'query-continue'. – svick
Загрузка результатов 4M 500 на 500 займет у вас ... – nneonneo