Я пишу простой инструмент для проверки дубликатов файлов (например, файлов с одинаковыми данными). Механизм состоит в том, чтобы генерировать хэши для каждого файла с использованием алгоритма sha-512, а затем хранить эти хэши в базе данных MYSQL. Я храню хэши в двоичном (64) уникальном столбце, отличном от нуля. Каждая строка будет иметь уникальный бинарный хэш и используется для проверки файла, дублируется или нет.Какой индекс следует использовать в столбце двоичного типа данных mysql
- Мои вопросы -
Могу ли я использовать индексы на двоичном столбце, моя по умолчанию таблица сортировки latin1 - по умолчанию параметры сортировки?
Какой механизм индексирования должен использовать Btree или Hash для получения высокой производительности? Мне нужно обновить или добавить 100 строк в секунду.
Какие еще вещи я должен позаботиться, чтобы получить лучшую производительность?
Я использую механизм хранения Innodb для таблицы хранения хэша, поэтому механизм индексации HEAP не будет доступен для него. Я думаю, индексация Btree не будет плохой. –