У меня есть документ с текстом в формате docx с данными в шаблоне повторяющегося формата.Преобразование docx и загрузка в таблицу sql
Я хотел бы взять все данные из повторяющегося набора и загрузить в строку таблицы SQL.
Пример данных здесь:
Question No : 1
How is LINQ to SQL different from Entities?
A. Answer 1
B. Answer 1
C. Answer 1
D. Answer 1
Answer : D
Explanations :
Some explanation.
Question No : 2
How is NVARCHAR different from VARCHAR
A. Answer 1
B. Answer 1
C. Answer 1
D. Answer 1
Answer : D
Explanations :
Some explanation.
я мог придумать несколько подходов:
- Прочитайте документ как DOCX с помощью Управления API
- Сохранить документ как XML из Слова и синтаксического анализа XML [ преобразованный XML-документ, похоже, не имеет структуры/схемы]
- Сохраните документ как HTML из Word и проанализируйте HTML. [Структура DOM не сформирована]
Какой из выше вы предложили бы и почему? Существуют ли какие-либо инструменты для преобразования документа и загрузки в таблицу SQL или доступ к БД?
Спасибо!