2016-05-17 8 views
2

Я новичок в solr и alfresco, и мне нужно создать solr 6 индекс импорта метаданных и контента из alfresco. Вы можете сказать, что alfresco уже имеет объем solr 4 со своим индексом, но я не могу его трогать, и на данный момент у него нет полей, кроме id и версии, поэтому это не полезно.как импортировать метаданные и содержимое alfresco в solr 6

Мне удалось создать документы в индексе, импортировав из oracle db, который я буду использовать для интеграции объектов, импортированных в конечном итоге из alfresco.

Пытались использовать под открытым небом API, которые возвращают JSON в ответ, но, даже если документация DIH говорит betweeen целей, «Сделать это можно плагин любой вид источника данных (ftp,scp etc) и любой другой формат пользовательского выбора (JSON,csv etc)», я не нашел ничего о нем

Кто-нибудь сталкивался уже с этой проблемой и как она ее разрешила? Надеюсь на ваши предложения и, возможно, на разные подходы.

+0

Ваша проблема заключается в том, как получить документы уже в Alfresco, чтобы вы могли индексировать их в своем собственном SOLR - в дополнение к уже имеющимся с установкой Alfresco - следую ли вы за вами? – Lista

+0

это правильно. То, что я действительно не понимаю, - это то, как пакет solr создает индекс, основанный на документе alfresco ... В конце концов я хотел бы реплицировать механизм. На данный момент я думаю о расширении URLDataSource или создании нового процессора для обработки json. Спасибо – herbie

+0

В дополнение к Jeff Pots ответ ниже, вы можете использовать тот же принцип, что и Alfresco в данный момент, и периодически меняйте изменения в SOLR. Хорошая отправная точка: http://alfresco.blog.redpill-linpro.com/2015/04/30/how-to-debug-solr-exceptionswarnings-for-alfresco-part-2/ – Lista

ответ

2

Похоже, вы хотите отправить информацию от Alfresco по своему усмотрению Solr 6. Вы не хотите прикасаться к встроенному серверу Solr, который поставляется с Alfresco, потому что вы, вероятно, сломаете что-то критическое для функционирования Alfresco.

Возможно, вы захотите взглянуть на этот проект: https://manifoldcf.apache.org. Его можно использовать для перекачки данных от Alfresco до Solr.

+0

Я уже знал коллектив, но нашел это сложно настроить. Поэтому я бы предпочел избежать этого. На данный момент я создаю собственный источник данных и JsonProcessor для dataimport. Я отправлю их, если мне удастся заставить их работать. – herbie

+0

На данный момент я создал банку с моим новым источником данных, и я изо всех сил пытаюсь понять, куда его поместить, чтобы быть foung от загрузчика сокетов/solr. Любые намеки? Единственный способ на данный момент - поместить единственный класс в dataimporthandler.jar, но при первом вызове, который вызывает, он терпит неудачу. – herbie

+0

Здравствуйте, по каким-то причинам stackoverflow решил, что я не могу отправить ответ. Мне удалось создать customDataSource, который вызывает службу отдыха, получает ответ в json, конвертирует в xml, а затем настраивает отображение через xpathProcessor, должен работать. – herbie