У меня есть контекст Camel, настроенный для выполнения некоторых манипуляций с входными данными, чтобы построить тройки RDF.Индексирование около 300 000 троек в кунжуте с помощью Camel
Существует окончательный маршрут с процессором, который с использованием Sesame Client API разговаривает с отдельным экземпляром Sesame (работает на Tomcat с 3 ГБ ОЗУ) и отправляет команды добавления (каждая команда содержит около 5 - 10 операторов).
Процессор работает как одноэлементный, а соответствующая «от» конечная точка имеет 10 параллельных вычислений (я пытался с 1, затем 5, затем 10 - безжизненное подобное поведение).
Я использую HttpRepository из своего процессора для отправки команд добавления, и во время работы я наблюдаю (быструю и) прогрессивную деградацию производительности при индексировании. В целом процесс начинает индексировать тройки очень быстро, но после небольшого количества зафиксированные заявления растут очень медленно.
На стороне кунжута я использовал как MemoryStore, так и NativeStore, но поведение (производительность) кажется не таким же.
Вопросы:
- , какой вид магазина рода в случае рекомендован я хотел бы ускорить этап индексации?
- Является ли Repository.getConnection выполнением каких-либо пулов соединений? Другими словами, можно ли открывать и закрывать соединение каждый раз, когда процессор «add» выполняет свою работу?
- Сказав, что мне нужно сначала создать магазин, все эти тройки, предпочтительнее ли создать «местный» магазин парусных судов вместо того, чтобы управлять им с удаленного сервера Sesame (поэтому я не буду использовать HTTPRepository)?