Мне нужно проанализировать десятки тысяч строк данных. Данные импортируются из текстового файла. Каждая строка данных имеет восемь переменных. В настоящее время я использую класс для определения структуры данных. Когда я читаю текстовый файл, я сохраняю каждый объект строки в общем списке List.Эффективный способ анализа больших объемов данных?
Мне интересно, следует ли мне переключиться на реляционную базу данных (SQL), поскольку мне нужно будет анализировать данные в каждой строке текста, пытаясь связать ее с терминами определения, которые я также храню в общих списках (список).
Целью является преобразование большого количества данных с использованием определений. Я хочу, чтобы определенные данные были фильтруемыми, доступными для поиска и т. Д. Использование базы данных имеет больше смысла, чем больше я думаю об этом, но я бы хотел подтвердить более опытные разработчики, прежде чем я внес изменения, но снова (я использовал структуры и сначала arraylists).
Единственный недостаток, о котором я могу думать, заключается в том, что данные не нужно сохранять после того, как он был переведен и просмотрен пользователем. Нет необходимости в постоянном хранении данных, поэтому использование базы данных может немного переборщить.
Файлы, которые я импортирую, содержат десятки тысяч строк, некоторые могут охватывать более 100 тысяч строк. Каждая строка имеет восемь полей, которые необходимо проанализировать и перевести. Например, одно поле может содержать значение «phy» и должно быть переведено на «Physical Layer» на основе файла определения. Я пытаюсь выяснить наиболее эффективный способ анализа и перевода этих данных. – Snooze
Собираетесь ли вы выполнять совокупный анализ данных или обрабатывать их только по очереди? Если позже, то чтение текстового файла и обработка по ходу дела могут быть довольно быстрыми, по сравнению с попыткой получить данные в SQL Express или Access. Тем не менее, поместить его в базу данных даст вам определенную гибкость, такую как возможность создавать индексы, которые вы должны были бы закодировать самостоятельно. – Thomas
Я думаю, что у меня нет другого выбора, кроме как сделать общий анализ, потому что некоторые определения зависят от предыдущих строк в текстовых файлах. Кроме того, при совокупном анализе я могу реструктурировать данные, чтобы сделать его более понятным/понятным. Даже если бы я работал на лету, мне все равно понадобилась бы структура данных, чтобы пользователь мог фильтровать/искать данные. – Snooze