Я использую apache hbase (версия 1.0.0) и phoenix (версия 4.6), развернутые через cloudera. Поскольку мои агрегации с группой по запросу медленны, я хочу попробовать отключить кеш-блок для конкретной таблицы hbase. Я попробовал несколько подходов, но не смог добиться успеха. Я проверяю, включен ли кеш блока в оболочку hbase - описать команду my_table.Отключить блокирующий блок HBase
- Set 'hfile.block.cache.size' свойство от Cloudera консоли 0
alter 'myTable', CONFIGURATION => {NAME => 'myColumnFamily', BLOCKCACHE => 'false'}
Даже после двух вышеупомянутых шагов, я получаю BLOCKCACHE => 'истинно' в описательной командный выход
COLUMN FAMILIES DESCRIPTION
{NAME => '0', DATA_BLOCK_ENCODING => 'FAST_DIFF', BLOOMFILTER => 'ROW', REPLICATION_SCOPE => '0', COMPRESSION => 'NONE', VERSIONS => '1', MIN_VERSIONS => '0', TTL => 'FOREVER',
KEEP_DELETED_CELLS => 'FALSE', BLOCKSIZE => '65536', IN_MEMORY => 'false', BLOCKCACHE => 'true'}
Что может быть не так? Какие-либо предложения?
спасибо.
Теоретически, имеет ли смысл блокировать кеш блока для агрегации и группировать по запросам? Предполагая, что это приведет к полному сканированию таблицы, я думаю, что это будет препятствовать производительности, если блок-кеш включен. Рассмотрим запрос на свертывание, например: SELECT SUM (UNIT_SOLD), SUM (TOTAL_SALES) FROM ГРУППЫ ОПЕРАЦИЙ ПО СТРАНАМ; Как вы думаете? –