2014-02-19 3 views
0

Я пытаюсь индексировать файл csv в Endeca.Indexing работает нормально в случае, если длина строки меньше 65536. Для больших данных она бросается ниже исключения.Ошибка при индексировании csv-файла

ФАТАЛЬНАЯ 02/18/14 15: 45: 53,122 UTC (1392738353122) подделывать {базовый}: TextObjectInputStream: во время чтения "/opt/soft/endeca/apps/MyApp/data/processing/TestRecord.csv", разделитель "" не найдено в пределах допустимого расстояния 65536 символов. ............................................. ..... ......................................... ОШИБКА 02/17/14 16:10 : 58.060 UTC (1392653458060) FORGE {базовая линия}: исключение ввода-вывода: ошибка чтения данных из Java: исключение EdfException: edf/src/format/Shared/TextObjectInputStream.cpp: 76. Сообщение: exit

Как увеличить этот предел для индексации больших данных (имеющих более 65537 символов в одной строке) в Endeca ?.

+0

Я считаю, что это 65537 по причине (2^16 + 1). Вы уверены, что ваша строка содержит столько данных? – radimpe

+0

@radimpe yes Я уверен, что строка содержит много данных. Это html-контент. –

ответ

0

Полагаю, вы исправили это. Если нет, ваша ошибка заключается в том, что разделитель строк не установлен правильно в вашем адаптере записи.

Если ваши записи законно так долго в CSV-файле, переключитесь на XML или что-то еще.

+0

Большое спасибо за ответ. В качестве работы мы индексируем меньше данных в Endeca.Но я попробую вариант xml. –

 Смежные вопросы

  • Нет связанных вопросов^_^