У меня есть требование, чтобы в главном интерфейсе моего приложения был прочитан и отображен огромный HTML-файл. Размер файла HTML составляет около 25 МБ. Пробовал несколько вариантов, как:Как читать огромный HTML-файл в Java?
Option 1:
try (Scanner scnr = new Scanner(file);) {
while (scnr.hasNextLine()) {
String line= scnr.nextLine();
}
}
Option 2:
FileUtils.readFileToString(file, "UTF-8");
Option 3:
IOUtils.toString(new FileInputStream(new File(file)), "UTF-8")
Все вышеуказанные 3 варианта не удается прочитать файл. Я не вижу ошибки. Обработка просто прекращается, и веб-страница выдает всплывающее окно «error» без информации.
Проблема заключается в том, что весь контент HTML-файла считывается как одна строка строки.
Есть ли способ, которым я могу прочитать этот файл?
Я рассмотрел несколько других вопросов здесь, чтобы узнать, есть ли возможное решение, но ничего не работает для этого случая.
пакет SAX-парсер в Java является довольно хороший. Я использовал его, и он очень быстрый и простой. Он анализирует любой XML, поэтому он должен отлично работать для HTML. – Gendarme
@ Gendarme Это ужасный совет. Для этого также потребуется XHTML, SAX не будет анализировать HTML. – Kayaman
Почему бы не разобрать HTML? – Gendarme