Мне нужен способ поиска по ключевым словам через (потенциально) сотни ГБ данных. Идеально что-то основано на распределенной хэш-таблице, которая хорошо работает с Java. Он должен быть отказоустойчивым и открытым исходным кодом.Нужна система поиска с распределенным ключом
Магазин должен быть постоянным, но идеально кэшировать данные в памяти, чтобы ускорить работу.
Он должен поддерживать параллельные считывания и записи с нескольких компьютеров (чтение будет 100X более распространенным, хотя). В основном цель заключается в быстром первоначальном поиске метаданных пользователя для веб-сервиса.
Может ли кто-нибудь порекомендовать что-нибудь?
Что вы оптимизации для?Например, пропускная способность чтения (одновременное считывание с нескольких компьютеров), отказоустойчивость в отношении того, что машины становятся недоступными, низкое количество машин ... Вам также нужны записи? – Alexander 2008-10-13 15:38:07
Спасибо, я отредактировал вопрос с этой информацией. – sanity 2008-10-13 15:41:38
Как вы хотите, чтобы ваши данные распространялись? Должны ли все данные быть доступны/в/из каждого узла или нет? В первом случае следующий вопрос: «Почему распределенный поиск?». – Alexander 2008-10-13 15:56:36