3

Я ищу, чтобы сделать некоторый бенчмаркинг по индексу полнотекстового поиска в PostgreSQL, SQLServer и Lucene.Пример базы данных для полнотекстового поиска

Любые идеи о том, где найти хорошую большую базу данных примеров для выполнения запросов?

Большое спасибо.

+0

Этот вопрос также будет по теме на http://opendata.stackexchange.com/ –

ответ

2

Я думаю, что лучшим источником будет база данных базы данных wikipedia, поскольку в ней содержится действительно большое количество текста. Их можно найти здесь: http://dumps.wikimedia.org/

Вы также можете попробовать архив usenet, но выбирать язык назначения труднее, и качество используемого языка также ниже.

+0

Хорошая точка. Это также может быть свалкой STACKOVERFLOW ... :-) –

 Смежные вопросы

  • Нет связанных вопросов^_^