2014-12-11 4 views
0

Я хотел бы использовать верстак для выполнения некоторых тестов, но я не мог понять, как его запустить, не указав запрос. Я хотел бы создать кластер документов, не указывая запрос с помощью инструментария. Является ли это возможным?Использование верстака carrot2 без указания запроса

Танки

ответ

0

два простейших варианта являются следующие:

  1. Преобразование данных в Carrot2 XML format и использовать исходный документ XML в Workbench, где запрос является необязательным.

  2. Создайте индекс Lucene из ваших данных и используйте источник документа Lucene. В этом случае запрос является обязательным, но вы можете использовать запрос catch-all *:* для кластеризации всех документов из индекса. This question содержит некоторые подсказки о преобразовании различных типов документов в требуемый индекс Lucene.

+0

Я попытался с помощью запроса '*: *', но произошло следующее исключение: 'INFO Объект из не- @ THREADSAFE класса org.apache.lucene.store.NIOFSDirectory связанного на инициализации времени для атрибута LuceneDocumentSource.directory. Убедитесь, что это предназначено. Исключение в теме "main" java.lang.NoSuchMethodError: org.apache.lucene.index.FieldInfo. (Ljava/lang/String; ZIZZZLorg/apache/lucene/index/FieldInfo $ IndexOptions; Lorg/apache/lucene/index/FieldInfo $ DocValuesType; Lorg/apache/lucene/index/FieldInfo $ DocValuesType; Ljava/util/Map;) V' Я использую carrot2 3.9.3 version – user1649606

+0

Это происходит в Workbench? –

+0

№Это происходит с использованием примеров Java API. При использовании рабочей среды происходит другая ошибка: Ошибка обработки: ... Формат версии не поддерживается (ресурс: NIOFSIndexInput (путь = ".../lucene-index-path/segment.gen")): -3 (требуется от -2 до -2) ' Я застрял в любых ситуациях – user1649606