2016-10-14 4 views
-2

Итак, скажем, у меня есть сайт с appx. 40000 статей. Что я надеюсь сделать, это записать количество посещений страниц за каждую статью сверхурочно.База данных для подсчета доступа к страницам

По сути, конечная цель состоит в том, чтобы визуализировать через график количество поисковых запросов для любой статьи между любым периодом времени.
Вот пример: https://books.google.com/ngrams

Я начал думать о структуре MySQL данных -> но мой мозг говорит мне, что это, вероятно, не является правильной задача для MySQL. Почти похоже, что мне нужно будет использовать определенное решение nosql analytics.

Может ли кто-нибудь советовать, какая БД подходит для этой работы?

ответ

0

SQL в порядке. Он поддерживает операторы UPDATE, которые гарантируют, что ваш счет будет правильным, а не просто конечной согласованностью.

Хотя большинство людей просто используют файл журнала и обрабатывают это по требованию. Если вы не масштаб Google, это будет достаточно быстро.

Существует множество инструментов для этого, часто включающих некоторые очень эффективные специализированные структуры данных, такие как RDD, которые вы не найдете в любой базе данных. Почему бы вам просто не использовать их?

+0

«SQL в порядке, он поддерживает UPDATE». Но я говорю о данных временных рядов. Я не могу просто обновить счетчик ->, который дал бы мне общее количество посещений в каждой статье. Мне нужно иметь возможность посещать несколько посещений за определенный период времени: с марта по апрель и иметь возможность генерировать хороший график для этого. – Dannyboy

+0

Использовать индекс в столбце времени? SQL-серверы очень хорошо подходят для выбора и агрегации диапазонов. Или используйте RDD. –