2013-08-02 6 views
1

Как хранить данные временных рядов датчиков в кассандре?временные ряды данных чтения данных

Здесь я Хава проверил производительность

В Cassandra композит ColumnFamily однорядные ключ, имеющий данные данные 10000 временных рядов, как, запрос: выберите * из deviceidcomposite где сделал предел = 'Dev001' 5000

случай 1:

Девид (ключ строки)

20120702105554 colname1=value 
    20120702105554 colname2=value 
    20120702105554 colname3=value 
    20120702105554 colname4=value 
    20120703105555 colname1=value 
    20120703105555 colname2=value 
    20120703105555 colname3=value 
    20120703105555 colname4=value 



    while we using cql3 to read single row key 5000 timeseries record it is taking nearly 3 min for 4 clumn 

случай 2:

Стандартный семейный столбец

diviceidcolumname1(row key) 

     20120703105552=value 
     20120703105553=value 
     20120703105554=value 
     20120703105555=value 
     .. 
     .. 
    diviceidcolumname2(row key) 

     20120703105552=value 
     20120703105553=value 
     20120703105554=value 
     20120703105555=value 
     .. 
     .. 
    diviceidcolumname4(row key) 

     20120703105552=value 
     20120703105553=value 
     20120703105554=value 
     20120703105555=value 
     .. 
     .. 
    diviceidcolumname4(row key) 
     20120703105552=value 
     20120703105553=value 
     20120703105554=value 
     20120703105555=value 
     .. 
     .. 

     (20120703105552->y/m/d/HH/MM/Sec) 
    using thrift api reading data perticular column name value or whole column name value 
    for one day(5000 timeseries data) 
    one month 
    it is comparing with cql less amount if time it's taking 
    nearly it taking 2 min 
    in this method reading single column name for one month is reading Very quick 

, какая из них таймсерия модель?

Любой другой лучший способ! увеличить свою производительность

+0

Последующий ответ на этот вопрос: http://stackoverflow.com/questions/17987921/cassandra-timeseries-datamodel – omnibear

ответ

2

Я не не думаю, что ваша проблема не модель данных (которые я предложил в своем предыдущем вопросе) ..

Простой ответ: сделать не использование предел!

Ограничьте согласованное усилие, чтобы решить, какие 5000 строк будут возвращены в качестве набора результатов. Это приведет к серьезному снижению производительности.

Если вам нужно ограничить количество результатов, используйте предложение WHERE (срезы столбцов). Они могут оцениваться каждым узлом индивидуально - oppsosite «limit»!

Кроме того, я думаю, что ответил на этот вопрос your previous question. Было бы справедливо, если бы вы пометили ответ соответственно, если (и только если) вы сочли его полезным. Благодарю.

+0

спасибо omnibear – kannadhasan

+0

спасибо omnibear. он работает отлично .. – kannadhasan

+0

, пожалуйста, нажмите на значок рядом с моим ответом, чтобы принять ответ, или обратитесь к ссылке, приведенной выше. благодаря! – omnibear

 Смежные вопросы

  • Нет связанных вопросов^_^