2013-07-04 7 views
12

Apache Giraph против Neo4j: Являются ли алгоритмы в обхода через узлы совершенно разные в тезисах две системы обработки графа? Если бы мы прошли, скажем, социальный граф с использованием Giraph и Neo4j на данных, хранящихся в одиночной машине (не распределенной), которая будет работать лучше и почему?Neo4j против Apache Giraph в обходе графа

ответ

22

Руки вниз Neo4j. Графовые вычисления графиков выполняются как задания Hadoop, потому что они предназначены для работы с большими распределенными графами. Накладные расходы на управление этими заданиями слишком велики, чтобы быть эффективными на мелкомасштабном графике, запущенном на псевдораспределенном одиночном кластере.

Не только это, но специальность Neo4j - это обход. Большая причина этого в том, что Neo4j фактически хранит смежные отношения в двусвязных списках в файловой системе. Проверьте эту запись в блоге:

http://digitalstain.blogspot.nl/2010/10/neo4j-internals-file-storage.html

Это объясняет, как Neo4j оптимизированный путь они хранят график, для быстрого графа операций, таких как обходы.

+3

Я согласен с этим ответом. Neo4j предназначался для анализа данных в режиме реального времени, на небольшом/среднем наборе данных (миллионы узлов/отношений), тогда как giraph/pregel предназначался для широкомасштабной распределенной работы, при обходах по размеру Интернета. – Nicholas

 Смежные вопросы

  • Нет связанных вопросов^_^