2016-06-06 4 views
0

Привет У меня есть CSV, который отделен от вкладок для каждого поля:Solr Regex - вкладка синтаксический отделено CSV

id name subject description comments 
c4e 10181 Hello1 d1 1 
741 10181 Hello2 d2 2 
b62 10181 Hello3 d3 3 
fd4 10181 Hello4 d4 4 
2fb 10181 Hello5 d5 5 

Я хотел регулярное выражение его с Solr Regextransformer, импортировать его через Dataimporthandler (DIH), но в конечном счете, регулярное выражение не работает:

<field column="id" sourceColName="rawLine" regex="^(.*)\t(.*)\t(.*)\t(.*)\t"/> 
<field column="name" sourceColName="rawLine" regex="\t(.*)\t(.*)\t(.*)\t(.*)$"/> 
<field column="subject" sourceColName="rawLine" regex="\t(.*)\t(.*)\t(.*)$"/> 
<field column="description" sourceColName="rawLine" regex="\t(.*)\t(.*)$"/> 
<field column="comments" sourceColName="rawLine" regex="\t(.*)$"/> 

Предмет, Decription и комментарии являются неправильными, они берут дополнительно предыдущие поля, что не так с регулярным выражением?

+0

Возможный дубликат [Solr DIH regextransformer - процессы только один CSV линии] (http://stackoverflow.com/questions/37629261/solr-dih- regextransformer-процессы-только-один-CSV-линия) –

ответ

0

Из вашего описания я бы сказал, что это проблема жадности. Помогает ли она заменить каждое вхождение .* в последние 3 линий .*?

 Смежные вопросы

  • Нет связанных вопросов^_^