Im работает Solr 1.4 на Ubuntu 10.04 (установлен через apt-get solr-tomcat), и он работает нормально. Мне трудно найти любую согласованную информацию о том, как индексировать документы. Im новый для S
Я использую ExtractingRequestHandler в Solr для получения содержимого документа и индексации его. Он отлично работает для всех документов Microsoft, но для PDF-файлов извлеченный контент пуст. Я также