2014-12-16 2 views
0

Я получаю следующее сообщение об ошибке при попытке загрузить большой RDF/XML документ в фусеки:Определение источника ошибок синтаксического анализа в Apache фусеки

> Code: 4/UNWISE_CHARACTER in PATH: The character matches no grammar rules of URIs/IRIs. These characters are permitted in RDF URI References, XML system identifiers, and XML Schema anyURIs. 

Как узнать, что строка содержит ошибку обижая?

Я попытался включить вывод в Log4j.properties, и я также попытался проверить файл RDF/XML с помощью инструмента rdfxml командной строки Jena (а также utf8 & riot) --- он проверяет отсутствие сообщений об ошибках. Но я новичок в этом наборе инструментов.

ответ

0

(версия?)

Проверьте "" -струны в данных RDF/XML для undesiravle URIs - особенно пробелов в URI.

Лучше всего проверить перед загрузкой: попробуйте riot YourFile и отправьте stderr и stdout в файл. Ошибки должны быть примерно в положении вывода парсера (N-тройки) в то время.

+0

Теперь я вижу проблему - путь, против которого он был против, был на самом деле путь к файлу RDF - я указал путь UNC, и, видимо, UNC-пути не поддерживаются. – MWood