Я разрабатываю приложение, которое обрабатывает наборы данных финансовой серии (входные данные как csv или открытый документ), один набор может быть указан в десятизначных числах от 1000 до двух чисел (упрощение, но это важно).Сохраните ряд данных в файле или базе данных, если я хочу выполнять математические операции на уровне строки?
Я планирую делать операции над этими данными (например, сумма, разница, средние и т. Д.), А также генерировать, скажем, другой столбец на основе вычислений на входе. Это будет между столбцами (операции на уровне строк) на одном наборе, а также между столбцами для многих (потенциально всех) наборов на уровне строк. Я планирую написать его на Python, и в конечном итоге ему понадобится интерфейс, ориентированный на интрасеть, для отображения результатов/графиков и т. Д., Теперь будет достаточно выхода csv на основе некоторых входных параметров.
Каков наилучший способ хранения данных и их обработки? До сих пор я вижу, что мой выбор состоит в том, чтобы либо (1) писать csv-файлы на диск, либо тратить их на выполнение математики, либо (2) я мог бы поместить их в базу данных и полагаться на базу данных для обработки математики. Моей главной задачей является скорость/производительность, так как число наборов данных растет, так как будет выполняться математическая математика на уровне ряда данных.
-У кого-нибудь был опыт, идущий по любому пути, и каковы подводные камни/ошибки, о которых я должен знать?
-Каковы причины, по которым нужно выбирать по другому?
-Есть ли какие-либо потенциальные проблемы с пропускной способностью/производительностью, которые мне нужно знать до того, как я начну, что может повлиять на дизайн?
-У вас есть проект или каркас, чтобы помочь с этим типом задачи?
-Edit- Подробнее: Ряды будут все читали все в порядке, но я, возможно, придется сделать некоторые передискретизации/интерполяции, чтобы соответствовать различным ввода длины, а также различной метки времени для каждой строки. Поскольку каждый набор данных всегда будет иметь разную длину, которая не является фиксированной, у меня будет некоторая таблица царапин/память где-нибудь, чтобы провести интерполированные/повторно сэмплированные версии. Я не уверен, имеет ли смысл пытаться сохранить это (и попытаться увеличить/объединить до общей более высокой длины) или просто восстановить его каждый раз, когда это необходимо.
добавлено больше информации; он будет считан в порядке – 2009-08-06 22:13:46