Я немного читал о хэшировании функций для уменьшения размерности. Я понимаю, что важно использовать хеш-функцию, которая имеет равномерное распределение выходных данных (вероятность того, что ввод будет сопоставлен с определенным значением, совпадает с любым другим значением в диапазоне), а также эффект лавины/каскада (небольшой изменение ввода приводит к большому изменению выхода). Эти свойства гарантируют, что столкновения между функциями не будут зависеть от их частоты. Тем не менее, я все еще не понимаю, как эффект лавины (в частности) влияет на это. Может ли кто-нибудь объяснить, почему/как это имеет значение здесь? Что представляет собой «большое изменение» в продукции?Функция Hashing/Avalanche Effect
Ссылки: http://blog.someben.com/2013/01/hashing-lang/ http://metaoptimize.com/qa/questions/6943/what-is-the-hashing-trick#6945