У меня есть таблица HBase, которая будет содержать миллионы записей. Для некоторых целей мне нужно запросить количество записей в таблице в реальном времени.Поиск таблицы строк таблицы HBase в реальном времени (миллисекунды)
- Использование задания MR-задания rowcount не является вариантом. (нужно быстро)
- Использование ResultScanner выполняется медленно. Требуется несколько секунд, когда всего несколько тысяч записей.
Существует один механизм добавления большего количества строк в таблицу, о которой я говорю. На самом деле я не совсем понял ваше упоминание о транзакциях с перекрестными таблицами. Вы имеете в виду, что строки могут получить дополнительные строки, если я не заметлю это? –
Если при добавлении строки в одну таблицу вы также увеличиваете счетчик в другой таблице, и что-то подавляет между обновлениями. HBase не гарантирует, что оба обновления будут успешными или не сработают вместе (без транзакции для двух обновлений). –
Спасибо Арнону. Я думаю, что это решение и Tariq оба почти одинаковы. Я проверю их. –