2010-10-07 8 views
0

Мне нужно разработать приложение для индексирования файлов в python и узнать, какая встроенная база данных является лучшей для индексирования.Какая встроенная база данных для приложений индексирования файлов

Любая помощь по этой теме оценивается. Спасибо,

Rajesh

+2

@ Rajesh Вы могли бы подробнее рассказать. Какие данные? Какой ребенок должен выполнять данные? –

+0

В основном я буду готовить сценарий для индексирования только локальных файлов и хочу сохранить полный текст и ключевые слова в db - аналогично Google Desktop –

ответ

2

вы могли бы использовать SQLite:

Еще один, что вы могли бы изучить это

Для индексации файлов есть такие инструменты, как pylucene, Xapian.

Другая соответствующая ссылка на SO

+0

Можете ли вы, пожалуйста, направить меня, что больше подходит для Python? –

+0

@Rajesh Vaya: Я бы предположил, что вы используете xapian, написанный в c/C++ и имеющий привязку к python. См. Мою отредактированную ссылку для других инструментов, таких как pylucene и whoosh. Xapian и woosh вполне способны на вашу работу. – pyfunc

+0

sqlite встроен в python. вы можете сделать это, и если по какой-то причине он не соответствует вашим потребностям, переместите ваши данные в другую базу данных. Одной из немногих критических замечаний, которые нужно знать в sqlite, является поддержка параллельного доступа. – bernie

0

Вы также можете проверить Firebird, которые имеют хорошие драйверы для Python
Вы также можете использовать sphinx добавить в Или вы также можете использовать lucene и firebird как infovark