2017-02-21 23 views
1

Есть ли какая-либо функция в MarkLogic, которая примет ввод как excel файл и преобразует его в XML файл.Функция Marklogic для преобразования файла excel в XML?

Я столкнулся с одной функцией xdmp:excel-convert(), но эта функция генерирует файл .xhtml. и не работает для .xlsx файлы расширения excel.

Я использую ML версии 7

ответ

3

Если установить Content Processing Framework и приложение преобразования, вы можете использовать его, чтобы переконвертировать формат .xls Excel упрощенному DocBook. Если вы прикрепляете конвейер Office OpenXML Extract, он будет обрабатывать распаковку и выполнять небольшую очистку в формате .xslx Excel.

1

В дополнение к хорошей рекомендации от mholstege, обратите внимание, что файлы .xlsx - это только файлы zip с XML внутри. Here's a blog post, приводя пример, как вытащить XML-файл из .docx.

0

Вы можете использовать xdmp:document-filter() для чтения XLSX и производства XHTML-вывода.

Я использовал xdmp:document-filter(), чтобы быстро/легко обрабатывать файлы XLXS и преобразовывать вывод XHTML в несколько документов XML, а затем вставлять их в базу данных MarkLogic.

Каждая строка будет производить XHTML <p> элемент (не забывают, что оно связано с пространством имен http://www.w3.org/1999/xhtml) с разделенными запятыми text() узел, представляющий каждый столбец данных, в дополнение к некоторым полезным <meta> элементов с информацией о файл.

Например строка с тремя столбцами: FooбарБаз

будет производить:

<p>foo,bar,baz</p> 

Вы можете выбрать значимые строки данных, а затем разметить значения CSV для создания столбцов для каждой строки данных в элементах <p>.

Вам может понадобиться, чтобы отфильтровать некоторые из <p> сгенерированных для листовых закладок:

<p>Sheet1</p> 

, а также строк, которые не содержат какие-либо значений и просто произвести последовательность запятых:

<p>,,,</p>