Я хочу использовать тройки RAG YAGO 3 (yago3_entire_ttl.7z от http://www.mpi-inf.mpg.de/departments/databases-and-information-systems/research/yago-naga/yago/downloads/) в triplestore apache-jena (3.1.0) с помощью tdbloader.Санируйте файлы YAGO перед загрузкой в apache-jena TDB triplestore
Инструмент бунт обеспечивается апача-Jena для подтверждения ввода дает 2 типов ошибок (несколько вхождений):
- недопустимое значение последовательности юникода побег: \\ (0x5c)
- недопустимый символ в IRI (codepoint 0x7C, '|')
Моя очевидная мысль - заменить '\\' и '|' с принятыми последовательностями символов, которые проходят проверку бунта, но я хотел знать, есть ли другое решение?
Та же проблема здесь, какие-то идеи? – n1try
Не решение, но мое обходное решение: в итоге я использовал версию Virtuoso с открытым исходным кодом из Openlink как triplestore вместе с библиотекой jena. Импортированные триплеты 670Mio без проблем в Centos Linux 7. –