ВступительныйАвтоматическое нахождение нумерации моделей в именах файлов
Я работаю в учреждении, где мы имеем микроскопов. Этим ребятам может быть предложено создать 4D-фильмы с образцом: они берут, например. 10 изображений в разных положениях Z, затем подождите некоторое время (следующая временная точка) и снова возьмите 10 срезов. Им может быть предложено сохранить файл для каждого фрагмента, и они используют явный шаблон именования, что-то вроде 2009-11-03-experiment1-Z07-T42.tif
. Имена файлов пронумерованы, чтобы отразить позицию Z и момент времени
Вопрос
После того как вы все эти имена файлов, вы можете использовать regex
шаблон для извлечения Z и значение T, если вы знаете, базовый шаблон имени файла. Это я знаю, как это сделать.
Вопрос, который у меня есть: знаете ли вы способ автоматического генерации шаблона регулярных выражений из списка имен файлов? Например, в сети есть удивительный инструмент, который делает аналогичную вещь: txt2re.
Какой алгоритм вы использовали бы для анализа всего списка имен файлов и генерации наиболее вероятного шаблона регулярного выражения?
Действительно интересный вопрос. Всякий раз, когда мне приходится делать регулярное выражение, я думаю об этом, но никогда не осмелюсь спросить, или люди могут подумать, что я сумасшедший! Потому что я думал, что это не будет даже отдаленно возможным, пока я не увижу ссылку, которую вы разместили :) –
Насколько я знаю, это _exactly_, что RegexMagic для: http://www.regexmagic.com/ – Huppie