AFAIK, Scala не имеет прямой поддержки HTML (хотя он поддерживает XML в построенных). Например:
scala> import scala.io.Source
scala> import scala.xml.XML
scala> val html = Source.fromURL("https://www.google.com")
scala> XML.loadString(html.toString)
org.xml.sax.SAXParseException; lineNumber: 1; columnNumber: 1; Content is not allowed in prolog.
at com.sun.org.apache.xerces.internal.util.ErrorHandlerWrapper.createSAXParseException(ErrorHandlerWrapper.java:198)
Это связано с тем, что все документы HTML не являются хорошо сформированными документами XML. Чтобы преодолеть это, вы можете использовать любую библиотеку обработки HTML в Java. Проверьте пример здесь:
http://alvinalexander.com/scala/scala-html-parsing
Стоит отметить, что действительный HTML документ не всегда является действительным документом XML (если это не XHTML) - не говоря уже о том, что в реальном мире HTML-страницы часто даже не действительны HTML для начала. Одним из решений является передача HTML через чистую библиотеку, которая попытается исправить что-либо недопустимое XML - [здесь приведен пример] (http://alvinalexander.com/scala/scala-html-parsing) с использованием библиотеки Java называемый HTMLCleaner. –