2013-08-23 3 views
0

Скажем, я запускаю какой-то общедоступный веб-сервис, и я, очевидно, хотел бы собирать показатели. Ради этого аргумента предположим, что интересующие меня данные будут только теми, что доступно при анализе стандартных журналов доступа Apache. Есть ли способ поддерживать эти типы аналитики, не сохраняя также идентификационную информацию о пользователях?Собирайте журналы и аналитики, сохраняя анонимность пользователей?

Я думал о таких вещах, как хэширование IP-адресов, но у этого есть много очевидных проблем.

ответ

1

Да. Вы можете анонимизировать IP-адреса, используя HMAC, если вы не хотите хранить IP-адреса в текстовом формате. Проблема может быть связана с URL-адресом реферала, который часто содержит параметры запроса, то же самое для запросов. Если, например, в запросе будет запрошена почта пользователя, вы должны заменить ее (например, uuid).

Проблема с хэшированием адресов IPv4 - это 32-разрядные, поэтому очень легко выполнить поиск по грубой силе. HMAC может немного улучшить эту ситуацию, если ключ не защищен. https://panopticlick.eff.org/ использует эту технику (с периодическим удалением/заменой клавиш).

Вы можете использовать http://bug.st/mod_anonstats для анонимного IP-адреса, но все равно считать пользователей.

Референции могут быть легко решены для чувствительных ссылок: http://www.whatwg.org/specs/web-apps/current-work/multipage/links.html#link-type-noreferrer Это, однако, предполагает современный браузер.