1
У меня есть этот XML-файл:csplit - что я делаю неправильно?
<docs>
<doc>
Some text
</doc>
<doc>
here some
</doc>
<doc>
text here
</doc>
</docs>
Я пытаюсь использовать csplit для того, чтобы получить только части текста. Это то, что я придумал.
$ csplit docs.xml '%^<docs>%1' '/^<\/doc/1' '{*}'
Это работает, но csplit создает разные файлы с содержимым между тегами, не так ли? Кошка просто печатает его на терминале. Любой способ получить эту функциональность для вашего подхода? –
imre
вы можете перенаправить весь вывод в файл, подобный этому cat x | sed -e 's/<[^>] *> // g' | grep -v '^ $'> output.txt –
Точка зрения состоит в том, текстовые файлы (документы), каждый из которых содержит контент между тегами. Поэтому первый из них будет содержать «Некоторый текст», второй - «здесь какой-то», а третий - «текст здесь». Это возможно? – imre