Что касается производительности и эффективности, лучше ли использовать множество небольших файлов (по лотам я имею в виду целых несколько миллионов) или пару (десять или около того) огромных (несколько гигабайтных) файлов? Давайте просто скажем, что я строю базу данных (не совсем так, но все, что имеет значение, это то, что к ней будет доступ к LOT).Много мелких файлов или пару огромных?
В основном я занимаюсь чтением. Моя файловая система в настоящее время ext3 на Linux (Ubuntu Server Edition, если это имеет значение), хотя я в состоянии, где я все еще могу переключиться, поэтому сравнение между различными файловыми системами было бы невероятным. По техническим причинам я не могу использовать реальную СУБД для этого (отсюда и вопрос), поэтому «просто использовать MySQL» не является хорошим ответом.
Заранее спасибо, и дайте мне знать, если мне нужно быть более конкретным.
EDIT: Я собираюсь быть хранение множества относительно небольших фрагментов данных, именно поэтому использования большого количества маленьких файлов будет проще для меня. Поэтому, если бы я пошел с использованием нескольких больших файлов, я бы только извлекал из них несколько КБ за один раз. Я бы тоже использовал индекс, так что это не проблема. Кроме того, некоторые данные указывают на другие части данных (он будет указывать на файл в случае с множеством мелких файлов и указывать на местоположение данных в файле в случае с большими файлами).
Чем более расплывчатым является информация, тем больше вы получите, 'это зависит' – McAden
Ну, какую еще информацию я должен добавить? Я не могу придумать ничего, что могло бы принести пользу этому вопросу. –
Профиль доступа к этим данным имеет большое значение. Собираетесь ли вы читать большие куски данных? Являются ли некоторые данные связанными и, скорее всего, будут доступны вместе? В какой-то момент вам лучше использовать БД, а не множество небольших файлов, если вы не делаете что-то, что ЛЕГКО, как обслуживание их через http, и оно должно быть ДЕЙСТВИТЕЛЬНО быстрым. – jamuraa