В моей домашней работе я должен разобрать некоторые файлы sgml. Я использую SAXParser. он работает правильно для простого файла xml. но когда я хочу, чтобы разобрать домашнее задание sgml файлов эта о
Это код from Python 2.7 HtmlParser: entityref = re.compile('&([a-zA-Z][-.a-zA-Z0-9]*)[^a-zA-Z0-9]')
Раньше я предполагал, что это будет больше похоже на это: entityref = re.compile('&([a-zA-Z][-.a-z
Мне нужно использовать именованные объекты для специального символа, но не удалось найти что-либо для двух символов U + 1e7c (Ṽ) & U + 1e7d (ṽ) ?, я искал, что он не смог найти нигде в доступных списк
Я думаю, что в XML и HTML не допускаются теги с перекрестными областями. Возможно SGML позволяет это. Однако в XML/HTML существуют ли допустимые и разрешенные случаи, когда это может произойти? Что-то