2013-10-28 3 views
0

(Продолжая обсуждение с тем же названием на форуме datastax). Я смог воспроизвести проблему, при которой opscenter не может подключиться к кластеру 2.0.1, используя «Использовать существующий кластер», не получив сообщение «Ошибка создания кластера: время ожидания вызова/кластера-configs». Это связано с наличием «rpc_server_type: hsha» в cassandra.yaml.Добавление кластера: «Ошибка при создании кластера: время ожидания вызова/кластер-config».

я воспроизводил его следующим образом:

(1), установленный в Ubuntu 12.04 (x86-64 архитектуры) в QEMU. Обновил его до последней версии всех пакетов. Настроил его со статическим IP-адресом (192.168.77.3). Сеть Qemu была настроена так, чтобы хост-компьютер и виртуальная машина qemu могли общаться.

(2) Скачан Sun jre-7u45-linux-x64.tar.gz и установил его. Установлена ​​libjna-java. Все это делается в соответствии с установкой datastax на документах Debian/ubuntu.

(3) Установленный datastax cassandra 2.0.1 с использованием пакета Debian, как описано в документах datastax.

(4) были сделаны следующие изменения в cassandra.yaml:

  • семян: "192.168.77.3" listen_address: 192.168.77.3 rpc_address: 192.168.77.3 rpc_server_type: hsha NB: Для того, чтобы увидеть отказ, очень важно использовать hsha.

(5) Остановлен экземпляр cassandra (Debian автоматически запускает его при установке). Обратите внимание, что сценарий инициализации не работает для остановки cassandra (это новая проблема с cassandra 2.0), поэтому мне пришлось убить процесс вручную. Это ловушка: вы можете подумать, что вы перезапустили cassandra, и что она приняла ваши изменения конфигурации во внимание, но только потому, что вы все еще используете старый экземпляр.

(6) очистил данные экземпляра: Суд ет -fr/вар/Библиотека/Cassandra/*

(7) Начало нового экземпляра CASSANDRA. Проверено, что nodetool может подключаться к нему как с виртуальной машины (т.е. выполняется локально), так и с главной машины.

(8) Пытался добавить кластер из беспроцессорного запуска на хосте (т. Е. Не работает на виртуальной машине). opscenter версии 3.2.2, ubuntu 13.10. Поскольку кластер еще не был добавлен, я получил диалог «Добро пожаловать в Datastax opscenter» с «Создать новый кластер» или «Использовать существующий кластер». Выберите «Использовать существующий кластер». Добавлен ip-адрес (192.168.77.3) экземпляра виртуальной машины qemu. Нажмите «Сохранить кластер». Это не удалось с помощью «Ошибка создания кластера: время ожидания вызова/кластера-configs».

Журнал OpsCenter:

2013-10-28 11:59:04+0100 [] INFO: Log opened. 
2013-10-28 11:59:04+0100 [] INFO: twistd 10.2.0 (/usr/bin/python2.7 2.7.5) starting up. 
2013-10-28 11:59:04+0100 [] INFO: reactor class: twisted.internet.selectreactor.SelectReactor. 
2013-10-28 11:59:04+0100 [] INFO: set uid/gid 0/0 
2013-10-28 11:59:04+0100 [] INFO: Logging level set to 'info' 
2013-10-28 11:59:04+0100 [] INFO: OpsCenter version: 3.2.2 
2013-10-28 11:59:04+0100 [] INFO: Compatible agent version: 3.2.2 
2013-10-28 11:59:04+0100 [] INFO: No clusters are configured yet, checking to see if a config migration is needed 
2013-10-28 11:59:04+0100 [] INFO: Main config does not appear to include a cluster configuration, skipping migration 
2013-10-28 11:59:04+0100 [] INFO: No clusters are configured 
2013-10-28 11:59:04+0100 [] INFO: HTTP BASIC authentication disabled 
2013-10-28 11:59:04+0100 [] INFO: Starting webserver with ssl disabled. 
2013-10-28 11:59:04+0100 [] INFO: SSL agent communication enabled 
2013-10-28 11:59:04+0100 [] INFO: opscenterd.WebServer.OpsCenterdWebServer starting on 8888 
2013-10-28 11:59:04+0100 [] INFO: Starting factory <opscenterd.WebServer.OpsCenterdWebServer instance at 0x2f2a6c8> 
2013-10-28 11:59:04+0100 [] INFO: morbid.morbid.StompFactory starting on 61619 
2013-10-28 11:59:04+0100 [] INFO: Starting factory <morbid.morbid.StompFactory instance at 0x3062320> 
2013-10-28 11:59:04+0100 [] INFO: Configuring agent communication with ssl support enabled. 
2013-10-28 11:59:04+0100 [] INFO: morbid.morbid.StompFactory starting on 61620 
2013-10-28 11:59:04+0100 [] INFO: OS Version: Linux version 3.11.0-12-generic ([email protected]) (gcc version 4.8.1 (Ubuntu/Linaro 4.8.1-10ubuntu7)) #19-Ubuntu SMP Wed Oct 9 16:20:46 UTC 2013 
2013-10-28 11:59:04+0100 [] INFO: CPU Info: ['2401.000', '1200.000', '1200.000', '2401.000', '1200.000', '1200.000', '1200.000', '2401.000'] 
2013-10-28 11:59:04+0100 [] INFO: Mem Info: 15979MB 
2013-10-28 11:59:04+0100 [] INFO: Package Manager: Unknown 
2013-10-28 12:03:02+0100 [] INFO: Starting factory <opscenterd.ThriftService.NoReconnectCassandraClientFactory instance at 0x31cd7e8> 
2013-10-28 12:03:02+0100 [] INFO: Adding new cluster 'Test_Cluster': {u'jmx': {u'username': u'', u'password': u'', u'port': u'7199'}, 'kerberos_client_principals': {}, 'kerberos': {}, u'agents': {}, 'kerberos_hostnames': {}, 'kerberos_services': {}, u'cassandra': {u'username': u'', u'seed_hosts': u'192.168.77.3', u'api_port': u'9160', u'password': u''}} 
2013-10-28 12:03:02+0100 [] INFO: Starting new cluster services for Test_Cluster 
2013-10-28 12:03:02+0100 [Test_Cluster] INFO: Starting services for cluster Test_Cluster 
2013-10-28 12:03:02+0100 [] INFO: Metric caching enabled with 50 points and 1000 metrics cached 
2013-10-28 12:03:02+0100 [] INFO: Starting PushService 
2013-10-28 12:03:02+0100 [Test_Cluster] INFO: Starting CassandraCluster service 
2013-10-28 12:03:02+0100 [Test_Cluster] INFO: agent_config items: {'cassandra_log_location': '/var/log/cassandra/system.log', 'thrift_port': 9160, 'thrift_ssl_truststore': None, 'rollups300_ttl': 2419200, 'rollups86400_ttl': -1, 'jmx_port': 7199, 'metrics_ignored_solr_cores': '', 'api_port': '61621', 'metrics_enabled': 1, 'thrift_ssl_truststore_type': 'JKS', 'kerberos_use_ticket_cache': True, 'kerberos_renew_tgt': True, 'rollups60_ttl': 604800, 'cassandra_install_location': '', 'rollups7200_ttl': 31536000, 'kerberos_debug': False, 'storage_keyspace': 'OpsCenter', 'ec2_metadata_api_host': '169.254.169.254', 'provisioning': 0, 'kerberos_use_keytab': True, 'metrics_ignored_column_families': '', 'thrift_ssl_truststore_password': None, 'metrics_ignored_keyspaces': 'system, system_traces, system_auth, dse_auth, OpsCenter'} 
2013-10-28 12:03:02+0100 [] INFO: Stopping factory <opscenterd.ThriftService.NoReconnectCassandraClientFactory instance at 0x31cd7e8> 
+0

Парень в команде OpsCenter здесь. У нас были сообщения об этой проблеме и они могут воспроизводиться с нашей стороны. Не уверен, что причина/исправить, так что я пока не отвечаю на ответ, но я буду, когда мы это выясним. – nickmbailey

ответ

1

Это происходит из-за ошибки в Кассандру, к сожалению:

https://issues.apache.org/jira/browse/CASSANDRA-6373

Чтобы обойти эту проблему на данный момент является использование синхронизации сервера бережливость. Если в OpsCenter будет применено обходное решение, я обновлю ответ.

+0

Любое обновление об ошибке? Перешел от hsha к синхронизации, и он просто сработал. Пахнет как состояние гонки ...? –

+0

Если вы проверите связанный билет, вы увидите, что ошибка исправлена ​​и будет выпущена в версии Cassandra версии 2.0.5. – nickmbailey