2014-03-27 10 views
0

Я использую эту обёртку HTMLTidy в .netиспользование HTMLTidy Управляется для части HTML

https://github.com/markbeaton/TidyManaged

имеет простой пример:

using System; 
using TidyManaged; 

public class Test 
{ 
public static void Main(string[] args) 
{ 
    using (Document doc = Document.FromString("<hTml><title>test</tootle>  <body>asd</body>")) 
    { 
    doc.ShowWarnings = false; 
    doc.Quiet = true; 
    doc.OutputXhtml = true; 
    doc.CleanAndRepair(); 
    string parsed = doc.Save(); 
    Console.WriteLine(parsed); 
    } 
} 
} 

я хочу использовать библиотеку кусок HTML не полная страница с «html» и «body» теги это возможно?

Я в основном хочу проверить открывающие и закрывающие метки и т. Д. и удалить теги без соответствующего открытия любого другого отличного инструмента.

ответ

0

я нашел ответ на это с помощью:

doc.OutputBodyOnly = AutoBool.Yes; 

, но в результате я получаю gibrish символов вместо UTF-8 (я использую ивритские символы) и узнаю, что это открытая ошибка 3 года .... https://github.com/markbeaton/TidyManaged/issues/2 это не решило проблему: doc.I nputCharacterEncoding = TidyManaged.EncodingType.Utf8; doc.OutputCharacterEncoding = TidyManaged.EncodingType.Utf8;

@Oscar Я проверю вашу рекомендацию благодаря

 Смежные вопросы

  • Нет связанных вопросов^_^