Parallel/Распределенные вычисления = SPEED < < Hadoop делает это на самом деле очень легко и дешево, так как вы можете просто использовать кучу товарных машин !!!
С годами емкость дискового хранилища увеличилась массово, но скорости, с которыми вы читали данные, не поддерживались. Чем больше данных у вас на одном диске, тем медленнее поиск.
Hadoop - это умный вариант разграничения подхода к решению проблем. Вы существенно разбиваете проблему на более мелкие куски и назначаете куски нескольким различным компьютерам для параллельной обработки параллельно ускорить работу до, а не перегружать одну машину. Каждая машина обрабатывает свой собственный подмножество данных, и результат объединяется в конце. Hadoop на одном узле не даст вам скорость, которая имеет значение.
Чтобы узнать о преимуществах hadoop, вы должны иметь кластер с не менее 4-8 товарными машинами (в зависимости от размера ваших данных) на одной стойке.
Вам больше не нужно быть супергероемным системным инженером, чтобы воспользоваться распределенными вычислениями. Просто знай хауп с Улей и твою доброту.
Какой аспект действия хаоса представляет интерес для вас? – 2011-08-14 11:44:23