Talend tFileOutputdelimited компонент - проблемы с разделенными CSV-файлами

Я пробовал свою удачу на форуме Talend, и мне не повезло, поэтому я попробую и здесь.Talend tFileOutputdelimited компонент - проблемы с разделенными CSV-файлами

У меня есть работа, которая читает большую таблицу, а затем записывает данные в CSV-файлы с шагом в 25000 строк. Я заметил, что все файлы .csv, созданные после первого .csv-файла, имеют все данные, загруженные в одну строку, в сравнении с первым .csv-файлом, который имеет данные, загруженные в 25000 строк (как я этого хочу).

Есть ли настройка, которая должна быть установлена на компонент tFileOutputDelimited, который позволит загружать строки во все последующие файлы .csv так, как они находятся в первом (и «хорошем») CSV-файле? Я думаю, что это может быть связано с тем, что используется для значения «Escape char» на вкладке «Предварительные настройки», но я не уверен.

На вкладке «Основные настройки» компонента tFileOutputDelimited значение разделителя строк CSV равно CRLF («\ r \ n»), а разделитель полей - «,». На вкладке «Дополнительные настройки» компонента значение Escape char равно «», а значение «Текст» также равно «».

Кроме того, это выполняется в среде Windows 7.

К сожалению, документация, которую я нашел для вкладки «Предварительные настройки» компонента tFileOutputDelimited, отсутствует в отношении параметров CSV.

Ниже приведен пример того, что встречается. Как показано ниже, первый файл выглядит великолепно, но все последующие файлы не ломаются на разрыв строки и в конечном итоге помещают все данные в одну строку по сравнению с отдельными строками.

Файл № 1

строка заголовка строка 1 строка 2 строка 3 ... строка 25000

Файл № 2 ...

заголовка rowrow1row2 ... row25000

Файл № 3 ...

heade r rowrow1row2 ... row25000

Если вам нужна дополнительная информация, сообщите мне, и я отправлю их сразу. Заранее спасибо.

источник

2013-06-21 Thomas Grady

Понял. Как упоминалось в моем первоначальном сообщении, разделитель строк CSV был установлен в CRLF («\ r \ n»). Я изменил это на LF ("\ n") и решил проблему. Я посмотрел на сгенерированный код Java и заметил, что он не рассматривает CRLF («\ r \ n») как одну из стандартных опций - только \ n и \ r. Это указывало мне на попытку использования опции \ n.

источник

2013-06-24 11:22:14

Теперь вы сможете отметить это как принято;) –

Talend tFileOutputdelimited компонент - проблемы с разделенными CSV-файлами

ответ

Смежные вопросы