Я создал разбитый db, который получает данные из ежедневных сохраненных файлов. Он работает нормально, но я обеспокоен тем, что kdb может добавлять повторяющиеся строки, если я дважды запускаю сценарий раздела с теми же файлами дня.Как обеспечить, чтобы данные таблицы разделенных kdb не дублировались?
Должен ли я использовать «ключ» для проверки существования секционированных таблиц или есть более простой способ застраховать, что kdb не будет дублировать сохраненные данные?
Это 1). Есть ли способ kdb для отслеживания загруженных файлов, или мне нужно будет сохранить какой-то пользовательский индикатор на диске? Я искал настройку разрешения kdb для блокировки записи после создания. Это было бы самым безопасным решением. Дублирование строк случайно приведет к катастрофе для анализа данных, который я выполняю, и дополнительные строки не будут сразу обнаруживаться. –
Вам нужно будет сохранить эту информацию самостоятельно. Вы можете включить столбец, который указывает файл, который содержит каждую запись в таблице. Имеются ли в каждом файле отдельные данные дня или есть ли несколько файлов на дату или даты на файл? – user1895961
Существует несколько файлов для каждой даты. Если я буду хранить один и тот же файл дважды, я бы исказил данные и дал неправильные результаты. Что делать, если я играю с разрешениями файла linux в каталоге разделов после создания? –