Так я должен разобрать уродливые файлы, которые содержат вложенные теги, какАнализ html-документа с помощью xmlpullparser?
<p>blah<strong>lah</strong>blah</p>
Вложенные теги определены и не заботиться о них. Но они делают XmlPullParser неудачу:
XmlPullParser parser = XmlPullParserFactory.newInstance().newPullParser();
parser.setInput(some_reader);
while (parser.next() != XmlPullParser.END_DOCUMENT) {
if (XmlPullParser.START_TAG == event) {
String tag = parser.getName();
if (tag != null) {
tag = tag.toLowerCase();
} else {
continue;
}
if ("p".equals(tag)) {
String text = parser.nextText();
// and here we go
// org.xmlpull.v1.XmlPullParserException: expected: /p read: strong
}
}
}
Вопроса: любой шанс, что я мог уйти без предварительной обработки файла вскрышного всех ненужных тегов или использовать сторонние библиотеки?
EDIT: Обновлен фрагмент, чтобы на самом деле иметь смысл.
что-то очень неправильно с этим терпит неудачу. Это абсолютно хорошо сформированный фрагмент XML. Я буду подвергать сомнению возможности инструмента XmlPullParser. – eyelidlessness
Уверены ли вы, что у вашей проблемы есть фрагмент
blah lah
blah? – CommonsWareВам нужен общий парсер, как описано [здесь] (http://www.gyanportal.com/article/generic-xmlpullparser-for-android/25) – Samdrain