2016-01-20 4 views
0

Когда я пытаюсь вставить данные, которые CSV-файл с разделителями по ; в таблицу Кассандры с помощью команды COPY я столкнулся ниже ошибки:Cassandra COPY неудачу

ErrorMessage code=000a [Protocol error] message="Cannot decode string as UTF8: 

'e23fa22f2[...truncated by author...]6f742c2e2729'; 

java.nio.charset.MalformedInputException: Input length = 1"> Aborting 
import at record #252. Previously inserted records are still present, 
and some records after that may be present as well. 

Мой CQL запрос

copy retail.products_by_id (product_id,product_name,price,supplier_id,supplier_name,category_id,category_name,release_date,description) FROM '/home/centos/retail_data/prod1_new.txt' WITH DELIMITER = ';' AND HEADER=true; 

Не уверен, что не так. Есть ли какие-либо проблемы с данными? Размер моего файла - 20 МБ. Нужны предложения, как исправить эту проблему.

ответ

0

252-я запись в файле /home/centos/retail_data/prod1_new.txt недействительна. Должен иметь возможность открыть его в редакторе и перейти к этой строке, чтобы увидеть его.

0

Откройте свой CSV в хорошем редакторе и посмотрите на 252-ю строку ваших данных (начните отсчет после заголовков). Там или строка bevore будет ошибкой - и/или ваши данные не являются текстом, а блобом.