Я новичок в Impala, я делаю несколько тестовых примеров на Impala. Я обнаружил, что аналогичные SQL-запросы намного быстрее, когда я звонил во второй раз.Имеет ли вложения impala некоторые данные после запросов
Например:
- Table1 = 4B строки
- таблица2 = 50M строк
1-й запрос: select * from table1 where id in (select id from table2 where xxx < 10000)
(20 секунд)
2-й запрос: select * from table1 where id in (select id from table2 where xxx < 9999)
(10 секунд)
третий запрос: select * from table1 where id in (select id from table2 where xxx < 100)
(1 секунда)
Я думаю Impala сделать некоторый специальный кэш, может кто-нибудь может сказать мне его причину?
Спасибо.
Я прочитал несколько блогов с http://www.cloudera.com/documentation/cdh/5-1-x/Impala/Installing-and-Using-Impala/ciiu_perf_stats.html Но я не нашел никаких статистика и кеш в таблицах или столбцах stat в моих таблицах; –