Исключение в doCheckpoint: Операция категории JOURNAL не поддерживается в состоянии ожидания

я создал HA-кластер с одним DataNode, активный NameNode, Standby NameNode и три JournalNode , когда был поставлен файл в HDFS получаю эту ошибку:Исключение в doCheckpoint: Операция категории JOURNAL не поддерживается в состоянии ожидания

put: Operation category READ is not supported in state standby

команда

положить:

./hadoop fs -put golnaz.txt /user/input

NameNode журнала:

at org.apache.hadoop.ipc.Client.call(Client.java:1476) 
    at org.apache.hadoop.ipc.Client.call(Client.java:1407) 
    at org.apache.hadoop.ipc.ProtobufRpcEngine$Invoker.invoke(ProtobufRpcEngine.java:229) 
    at com.sun.proxy.$Proxy15.rollEditLog(Unknown Source) 
    at org.apache.hadoop.hdfs.protocolPB.NamenodeProtocolTranslatorPB.rollEditLog(NamenodeProtocolTranslatorPB.java:148) 
    at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer.triggerActiveLogRoll(EditLogTailer.java:273) 
    at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer.access$600(EditLogTailer.java:61) 
    at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.doWork(EditLogTailer.java:315) 
    at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.access$200(EditLogTailer.java:284) 
    at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread$1.run(EditLogTailer.java:301) 
    at org.apache.hadoop.security.SecurityUtil.doAsLoginUserOrFatal(SecurityUtil.java:415) 
    at org.apache.hadoop.hdfs.server.namenode.ha.EditLogTailer$EditLogTailerThread.run(EditLogTailer.java:297) 
2016-09-15 02:07:23,961 INFO org.apache.hadoop.ipc.Server: IPC Server handler 9 on 9000, call org.apache.hadoop.hdfs.server.protocol.NamenodeProtocol.rollEditLog from 103.41.177.161:45797 Call#11403 Retry#0: org.apache.hadoop.ipc.StandbyException: Operation category JOURNAL is not supported in state standby 
2016-09-15 02:07:30,547 INFO org.apache.hadoop.ipc.Server: IPC Server handler 0 on 9000, call org.apache.hadoop.hdfs.server.protocol.NamenodeProtocol.rollEditLog from 103.41.177.160:39200 Call#11404 Retry#0: org.apache.hadoop.ipc.StandbyException: Operation category JOURNAL is not supported in state standby

Ошибка в журнале SecondaryNameNode:

ERROR org.apache.hadoop.hdfs.server.namenode.SecondaryNameNode: Exception in doCheckpoint 
org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.ipc.StandbyException): Operation category JOURNAL is not supported in state standby

и это HDFS-site.xml:

<configuration> 
<property> 
    <name>dfs.data.dir</name> 
    <value>/root/hadoopstorage/data</value> 
    <final>true</final> 
</property> 
<property> 
    <name>dfs.name.dir</name> 
    <value>/root/hadoopstorage/name</value> 
    <final>true</final> 
</property> 
<property> 
    <name>dfs.replication</name> 
    <value>1</value> 
</property> 
<property> 
    <name>dfs.webhdfs.enabled</name> 
    <value>true</value> 
</property> 
<property> 
    <name>dfs.nameservices</name> 
    <value>ha-cluster</value> 
</property> 
<property> 
    <name>dfs.ha.namenodes.ha-cluster</name> 
    <value>NameNode,Standby</value> 
</property> 
<property> 
    <name>dfs.namenode.rpc-address.ha-cluster.NameNode</name> 
    <value>103.41.177.161:9000</value> 
</property> 
<property> 
    <name>dfs.namenode.rpc-address.ha-cluster.Standby</name> 
    <value>103.41.177.162:9000</value> 
</property> 
<property> 
    <name>dfs.namenode.http-address.ha-cluster.NameNode</name> 
    <value>103.41.177.161:50070</value> 
</property> 
<property> 
    <name>dfs.namenode.http-address.ha-cluster.Standby</name> 
    <value>103.41.177.162:50070</value> 
</property> 
<property> 
    <name>dfs.namenode.shared.edits.dir</name> 
    value>qjournal://103.41.177.161:8485;103.41.177.162:8485;103.41.177.160:8485/ha-cluster</value> 
</property> 
<property> 
    <name>dfs.client.failover.proxy.provider.ha-cluster</name> 
    <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value> 
</property> 
<property> 
    <name>dfs.ha.fencing.methods</name> 
    <value>sshfence</value> 
</property> 
<property> 
    <name>dfs.ha.fencing.ssh.private-key-files</name> 
    <value>/root/.ssh/id_rsa</value> 
</property> 
<property> 
    <name>dfs.ha.fencing.ssh.connect-timeout</name> 
    <value>3000</value> 
</property> 
</configuration>

источник

2016-09-15 Golnaz Ardeshiri

Вы ничего о автоматического восстановления (ZKFC & Zookeeper) не упоминается. Без него hdfs автоматически не переключится.

Вы можете попробовать следующее: убедитесь, что оба ваших namenodes находятся в состоянии ожидания , проверяя namenodes консоли (или с помощью команды getServiceState из Administrative commands). Если это так, вручную активируйте переход с помощью команды -transitionToActive и хвост одновременно регистрируются журналы. В случае отказа перехода обновите свой пост с помощью журналов namenode.

источник

2016-09-16 12:11:08

Да, ничего не упоминал об автоматическом отказоустойчивости. bc я хочу сделать failover manully –

Исключение в doCheckpoint: Операция категории JOURNAL не поддерживается в состоянии ожидания

ответ

Смежные вопросы