2013-03-19 3 views
1

Мы разрабатываем приложение, которое использует очень большую базу данных. Основные операции, она должна поддерживать следующие: -Найти все идентификаторы полигонов для данной карты ID -для каждого из полигонов, получить coorginates нарисовать его (4 координаты)База данных Best (NoSQL) для запроса больших данных

Итак, это все об оптимизации чтение. Отсутствие письменности, отсутствие проблем с согласованностью. Конечно, важны некоторые дополнительные вещи, но это ключ. Количество кортежей для многоугольников чрезвычайно велико, в диапазонах сотен миллионов (несколько терабайт).

Можете ли вы предложить лучшую базу данных для этого? Нашими фаворитами на данный момент являются Sharded Mysql, MongoDB и CouchBase.

+0

"Большая база данных" очень субъективна. Можете ли вы дать нам представление об измеримых терминах? Gbs/ТБ размера? И какие операции вы хотите делать? –

+0

Большая база данных, имеющая ~ 10 терабайт данных. Операции запроса, о которых я говорил выше: 1. Для данной карты найдите все многоугольники (на самом деле их идентификаторы), необходимые (и общую информацию о карте). 2. Для всех идентификаторов многоугольников получите необходимую информацию для их рисования - координаты (x1, y1, x2, y2) –

ответ

0

Я все еще пытаюсь понять, какие операции вам понадобятся (я - это нуд, когда речь идет о ГИС). Но вот моя попытка (lame?) Сделать некоторые рекомендации -

Если вы хотите придерживаться РСУБД, вы можете использовать PostGRESQL с GridSQL, что привносит функцию параллельного выполнения запросов в ваши SQL-запросы. У меня есть коллега, который видел значительную выгоду, используя это.

Вот пример на масштабирование PostGres with GridSQL

Если вы более открыты для экспериментов, я хотел бы, чтобы рассмотреть Apache HBase, которая имеет хорошую репутацию в bigdata пространства.