Я использую MongoDB как временный магазин журналов. Коллекция получает ~ 400 000 новых строк в час. Каждая строка содержит временную метку UNIX и строку JSON.Коллекция MongoDB, используемая для данных журнала: индекс или нет?
Периодически я хотел бы скопировать содержимое коллекции в файл на S3, создав файл за каждый час, содержащий ~ 400 000 строк (например, today_10_11.log содержит все строки, полученные между 10:00 и 11:00). Мне нужно сделать эту копию, пока коллекция получает вставки.
Мой вопрос: каково влияние производительности на индекс в столбце timestamp на 400 000 часовых вставок стихов дополнительное время, которое потребуется, чтобы запросить количество часов в строках.
Данное приложение используется в Ruby, запущенном на Heroku, и с использованием плагина MongoHQ.
Это хороший совет о дате в BSON ID. У меня должен был быть отметчик времени, потому что я также импортировал много старых журналов, где дата вставки не была датой события. Но я думаю, что для приложения здесь ваше решение, вероятно, будет хорошим. –