2016-02-11 5 views
1

Я хочу прочитать в кучке CSV-файлов. Например, этот (movies_user.cleaned.csv) содержит 2 переменные: uid (идентификатор пользователя) и имя фильма. Поскольку SAS только считывает первые 20 строк для угадывания длины строки, мои данные обрезаются. («Гарри Поттер» часто меняется на «Гарри Пот» и т. Д.)Данные всегда усекаются в SAS Proc Import (CSV)

Я знаю, что я могу использовать guessingrows = 32767 (32767 - это максимум, который можно использовать) в моем коде, чтобы SAS проверила первые 32767 строк , но я не думаю, что это достаточно безопасно, чтобы не урезать. Некоторые из моих CSV намного больше, чем это.

Вот код я использую:

proc import datafile="H:\FBDATA_CLEANED\facebookdata2\movies_user.cleaned.csv" 
out=thesis.activities2 
dbms=csv 
replace; 
getnames=yes; 

run; 

Может вы, ребята, помочь мне немного? Благодаря!

ответ

3

Пробег PROC IMPORT вручную. В журнале вы увидите код DATA STEP, который он сгенерировал.

Скопируйте этот код.

Заменить PROC IMPORT с этим DATA STEP.

Отредактируйте размер операторов INFORMAT и FORMAT, чтобы поле было достаточно большим.

Используйте код DATA STEP в дальнейшем.

+0

Вы также можете открыть новое окно редактора после импорта и нажать F4, на котором будет отображаться последний представленный код. Сохраняет копирование из журнала и удаление номеров строк – Longfish

+0

Согласитесь, если он не использует Enterprise Guide, то вы не можете. Если я не пропустил эту функцию (при условии, что я не использую EG, если я не обязан). – DomPazz

+0

Я этого не знал, но я не использовал EG около 8 лет! – Longfish

 Смежные вопросы

  • Нет связанных вопросов^_^