сначала извините меня за мой плохой английский! Я хочу найти в pdf документ для слова типа «Привет». Поэтому я должен прочитать каждую страницу в формате pdf от PdfTextExtractor. Я сделал это хорошо. Я могу читать все слова на каждой странице отдельно и сохранять их в строчном буфере. , но когда я нажимаю этот код в цикле For (например, со страницы 1 на 7 для поиска в нем), слова предыдущей страницы останутся в буфере строк. Я хожу, что вы понимаете мою проблему. Tanx все. это мой код:Проблема с PdfTextExtractor в itext!
PdfReader reader2 = new PdfReader(openFileDialog1.FileName);
int pagen = reader2.NumberOfPages;
reader2.Close();
ITextExtractionStrategy its = new iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy();
for (int i = 1; i < pagen; i++)
{
textBox1.Text = "";
PdfReader reader = new PdfReader(openFileDialog1.FileName);
String s = PdfTextExtractor.GetTextFromPage(reader, i, its);
//MessageBox.Show(s.Length.ToString());
//PdfTextArray h = new PdfTextArray(s);
//
// s = "";
s = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.Default, Encoding.UTF8, Encoding.Default.GetBytes(s)));
textBox1.Text = s;
reader.Close();
}
Что такое линия "s = Encoding.UTF8.GetString (..." намеревался сделать –
@? ThomasS, хороший вопрос! Похоже, что он кодирует текст, меняет кодировку и расшифровывает его, другими словами, вероятно, ничего полезного. – Sam
@ThomasS: Я использовал эту строку кода, потому что пытался читать персидские символы. – 2014-07-21 20:58:26