Вы можете использовать xdmp:document-filter() для чтения XLSX и производства XHTML-вывода.
Я использовал xdmp:document-filter()
, чтобы быстро/легко обрабатывать файлы XLXS и преобразовывать вывод XHTML в несколько документов XML, а затем вставлять их в базу данных MarkLogic.
Каждая строка будет производить XHTML <p>
элемент (не забывают, что оно связано с пространством имен http://www.w3.org/1999/xhtml
) с разделенными запятыми text()
узел, представляющий каждый столбец данных, в дополнение к некоторым полезным <meta>
элементов с информацией о файл.
Например строка с тремя столбцами: FooбарБаз
будет производить:
<p>foo,bar,baz</p>
Вы можете выбрать значимые строки данных, а затем разметить значения CSV для создания столбцов для каждой строки данных в элементах <p>
.
Вам может понадобиться, чтобы отфильтровать некоторые из <p>
сгенерированных для листовых закладок:
<p>Sheet1</p>
, а также строк, которые не содержат какие-либо значений и просто произвести последовательность запятых:
<p>,,,</p>