У меня есть несколько текстовых файлов, которые необходимо подделать, POS и NER. Я использую тегеры C&C и запустил их учебник, но мне интересно, есть ли способ пометить несколько файлов, а не один за другим.Как мне перебирать несколько файлов, сохраняя базовое имя для дальнейшей обработки?
На данный момент я tokenising файлы:
bin/tokkie --input working/tutorial/example.txt--quotes delete --output working/tutorial/example.tok
следующим образом, а затем часть речи мечения:
bin/pos --input working/tutorial/example.tok --model models/pos --output working/tutorial/example.pos
и, наконец, Названный Признание Entity:
bin/ner --input working/tutorial/example.pos --model models/ner --output working/tutorial/example.ner
I я не уверен, как бы я хотел создать цикл для этого и сохранить имя файла так же, как и вход, но с расширением, обозначающим его пометку. Я думал о сценарии bash или, возможно, Perl, чтобы открыть каталог, но я не уверен, как вводить команды C & C, чтобы понять сценарий.
В настоящий момент я делаю это вручную, и это занимает много времени, чтобы сказать наименее!
Супер большое спасибо – jenniem001