Кто-нибудь знает метод или библиотеку для преобразования SGML в XML?Преобразование Java SGML в XML?
EDIT: Для уточнения, я должен сделать преобразование в Java, и я не могу использовать парсер SP или связанный с ним инструмент SX.
Кто-нибудь знает метод или библиотеку для преобразования SGML в XML?Преобразование Java SGML в XML?
EDIT: Для уточнения, я должен сделать преобразование в Java, и я не могу использовать парсер SP или связанный с ним инструмент SX.
Похоже, что общий консенсус в том, что для работы SGML в Java нет существующих библиотек. Конечно, после нескольких дней бесплодного поиска в Google и задавая этот вопрос здесь, я не нашел ресурсов по этому вопросу.
Ответ не всегда так прост, так как он зависит от DTD sgml. Я вообще не нашел общий синтаксический анализатор SGML в Java, но this article использует SP, который включает в себя конвертер.
Если бы я мог использовать SX для преобразования, я был бы счастливым человеком. Мне запрещено использовать Java для преобразования. –
Почему? Можете ли вы назвать SX из Java? –
См. http://jclark.com/sp/sx.htm для конвертера SX от SGML к XML в пакете SP.
Существует mlParser, но я с трудом пытается найти его: http://www.balisage.net/Proceedings/vol1/html/Smith01/BalisageVol1-Smith01.html
Там нет апи для разбора SGML с помощью Java в это время. Там также нет каких-либо api или библиотеки для преобразования SGML в XML и последующего анализа его с помощью Java. Поскольку статус SGML вытесняется XML для всех проектов, над которыми я работал до сих пор, я не думаю, что в этой области будет любая работа, но это только предположение.
Here - это код с открытым кодом от университета, который это делает, однако я его не пробовал, и вам нужно будет искать другие зависимые классы. Я считаю, что единственное жизнеспособное решение на Java потребует регулярных выражений.
Также имеется link для общего программного обеспечения SGML/XML.
SGML - это надмножество XML; что бы вы хотели, чтобы семантика преобразования была? Есть ли определенное преобразование, которое вы хотите? – Calum
Я знаю, что это надмножество XML. Семантика преобразования, которое я хотел бы выполнить, состоит в том, что результирующий XML хорошо сформирован - он не обязательно должен проверяться на соответствие схеме. –