2016-06-15 5 views
2

Мы определили схему Solr в IBM Watson for Worksheet как набор вопросов. Существует несколько элементов схемы, которые являются многозначными полями. Мы можем загружать документы и индексировать документы, используя службы Retrieve и Rank, но при генерации набора учебных данных мы получаем ошибки преобразования типа данных.IBM watson Извлечение и ранговая ошибка обучения «java.util.ArrayList нельзя отнести к java.lang.Float»

Схема

<field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false"/> 
    <field name="worksheet_number" type="watson_text_en" indexed="true" stored="true" /> 
    <field name='question_number' type='int' indexed='true' stored='true' multiValued='true' /> 
    <field name='question_type' type='watson_text_en' indexed='true' stored='true' multiValued='true' /> 
    <field name='answer' type='watson_text_en' indexed='true' stored='true' multiValued='true' /> 
    <field name='text' type='watson_text_en' indexed='true' stored='true' multiValued='true' /> 

команда Обучение с использованием train.py, которая генерирует исключение локон -u "***********": "******* *****»" https://gateway.watsonplatform.net/retrieve-and-rank/api/v1/rankers/3b140ax15-rank-3108

к сожалению, исключение не дает никакой информации о каком поле он бросает исключение.

Java.lang.ClassCastException: java.util.ArrayList cannot be cast to java.lang.Float 
    at com.ibm.watson.hector.plugins.ss.FCFeatureGeneratorComponent.toCSV(FCFeatureGeneratorComponent.java:677) 
    at com.ibm.watson.hector.plugins.ss.FCFeatureGeneratorComponent.process(FCFeatureGeneratorComponent.java:364) 
    at org.apache.solr.handler.component.SearchHandler.handleRequestBody(SearchHandler.java:272) 
    at org.apache.solr.handler.RequestHandlerBase.handleRequest(RequestHandlerBase.java:155) 
    at org.apache.solr.core.SolrCore.execute(SolrCore.java:2082) 
    at org.apache.solr.servlet.HttpSolrCall.execute(HttpSolrCall.java:651) 
    at org.apache.solr.servlet.HttpSolrCall.call(HttpSolrCall.java:458) 
    at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:229) 
    at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:184) 
    at org.eclipse.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1652) 
    at org.eclipse.jetty.servlet.ServletHandler.doHandle(ServletHandler.java:585) 
    at org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:143) 
    at org.eclipse.jetty.security.SecurityHandler.handle(SecurityHandler.java:577) 
    at org.eclipse.jetty.server.session.SessionHandler.doHandle(SessionHandler.java:223) 
    at org.eclipse.jetty.server.handler.ContextHandler.doHandle(ContextHandler.java:1127) 
    at org.eclipse.jetty.servlet.ServletHandler.doScope(ServletHandler.java:515) 
    at org.eclipse.jetty.server.session.SessionHandler.doScope(SessionHandler.java:185) 
    at org.eclipse.jetty.server.handler.ContextHandler.doScope(ContextHandler.java:1061) 
    at org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:141) 
    at org.eclipse.jetty.server.handler.ContextHandlerCollection.handle(ContextHandlerCollection.java:215) 
    at org.eclipse.jetty.server.handler.HandlerCollection.handle(HandlerCollection.java:110) 
    at org.eclipse.jetty.server.handler.HandlerWrapper.handle(HandlerWrapper.java:97) 
    at org.eclipse.jetty.server.Server.handle(Server.java:499) 
    at org.eclipse.jetty.server.HttpChannel.handle(HttpChannel.java:310) 
    at org.eclipse.jetty.server.HttpConnection.onFillable(HttpConnection.java:257) 
    at org.eclipse.jetty.io.AbstractConnection$2.run(AbstractConnection.java:540) 
    at org.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.java:635) 
    at org.eclipse.jetty.util.thread.QueuedThreadPool$3.run(QueuedThreadPool.java:555) 
    at java.lang.Thread.run(Thread.java:745)\n","code":500}} 

Ther e, похоже, проблема с полями MultiValue, определенными в Схеме и генерирующими данными обучения, установленными для него. Поля MultiValue позволяют хранить несколько вопросов, тексты для данного номера рабочего листа с любыми типами данных. Например. целое число для номера вопроса со значениями [1,2,3,4,5] в поле question_number.

При создании набора данных обучения Watson API генерирует исключение с ошибкой преобразования типа данных "java.util.ArrayList не может быть передан в java.lang.Float".

ответ

1

Эта проблема потенциально вызвана наличием в ваших данных многозначного поля, называемого «оценка». Это может быть явно определенное поле в schema.xml или допустимое динамическое поле в некоторых документах. Не могли бы вы проверить, так ли это? Если это так, его нужно будет изменить на другое имя (например, «my_score»), потому что это противоречило бы имени, жестко запрограммированному Solr для возврата баллов.

+0

Спасибо за поддержку. У нас есть поле «score», я изменю схему, попробую загрузить и подтвердить, работает ли она. –

+0

Теперь он работает, мы прошли исключение и создаем набор учебных материалов –