Нет Это не идеальное. Вам решать, как настроить кластер. В этом учебнике автор решил использовать node1
как P-NN и S-NN одновременно. Имейте в виду, что RPi Hadoop Cluster подходит только для разработки и тестирования, а не для производственной среды.
За и против запуска первичного и вторичного NameNode NameNode на отдельную машине (на основе This article от Cloudera):
1.Scalability. Для создания моментального снимка системы требуется столько же памяти, сколько и сам NameNode. Поскольку память, доступная для , процесс NameNode является основным ограничением размера распределенной файловой системы , для крупномасштабного кластера потребуется большая или вся доступная память для NameNode.
2. Долговечность. Когда SecondaryNameNode создает контрольную точку, он делает это в отдельной копии метаданных файловой системы. Перемещение этого процесса на другую машину также создает копию файла метаданных на независимой машине, увеличивая ее долговечность.
Это не идеальный вариант. С Hadoop 2.x, Active Namenode возьмет на себя роль Namenode, если Namenode не работает. Посмотрите на соответствующий вопрос SE: http://stackoverflow.com/questions/19970461/name-node-vs-secondary-name-node/34716750#34716750 –