У меня есть 100 миллионов записей в моей коллекции «sample». Я хочу иметь другую коллекцию со всеми различными именами пользователей «user.screen_name»Отдельные значения ключа в поддоку MongoDB (100 миллионов записей)
У меня есть следующая структура в моей базе данных MongoDB «образец» коллекция:
{
"_id" : ObjectId("515af34297c2f607b822a54b"),
"text" : "random text goes here",
"user" :
{
"id" : 972863366,
"screen_name" : "xname",
"verified" : false,
"time_zone" : "Amsterdam",
}
}
Когда я пытаюсь что-то вроде «отчетливый ('user.id) .length „Я получаю следующее сообщение об ошибке:
"errmsg" : "exception: distinct too big, 16mb cap",
Мне нужна эффективного способ иметь другую коллекцию только {„user_name“:„имя“} различных пользователей в моем“ сбор образцов. поэтому я могу запросить размер этой новой базы данных и получить количество отдельных пользователей. (и для дальнейшего анализа в будущем)
Вы помечено это с MapReduce, пытались ли вы использовать MapReduce MongoDB в? – WiredPrairie
Не совсем, я знаю, что ответ может быть использован mapreduce, однако я не очень хорошо знаком с синтаксисом и концепцией. – amaatouq
Начните с документации. Это хорошее место для начала. http://docs.mongodb.org/manual/core/map-reduce/ – WiredPrairie