2016-06-27 1 views
0

Я пытаюсь написать кадр данных в формат паркетного кадр данныхSparkR Написать в паркетном файл

ул (тест) «data.frame» :. 365 набл из 4-х переменных: $ ID: CHR «Яблоко» «Яблоко» «Яблоко» «Яблоко» ... $ текст: CHR «Ши передать его на диффузионный перенос надежду на \ npsychopass психопаты Торговый резиновый ремешок Ginoza Shinmoto \ N выгоды круг обычно круг судоходства вы даже от поиска вы «| усеченный» ретвит \ п \ npeachpanther альбумин мир прямо сейчас «» Гарлем vacature интернет strateeg opzoek Naar CTO разработчик программного обеспечения architectlead звезда applehaarl «» ใน อ ย ท เทา ก น \ п ผ ห ญ ง ม ความ เป น ผ ให ญ มาก ก วา ผ ชาย \ п ไม ม ผ ชาย คน ไหน ไป ได สวย กบ ผ ห ญ ง อาย เทา ก น ได หรอก \ п ты «Ш» | усеченный ... $ эмоции: CHR «неизвестный» «неизвестный» «неизвестный» «неизвестный» ... $ полярность: CHR «позитивный» «позитивный» «позитивный» «позитивный» ...

Когда я пытаюсь использовать write.parquet я получаю следующую ошибку

write.parquet (тест, "HDFS: //xxx.xxx.xxx.xxx: 9000/orcladv/intdata/processedtweets") Ошибка в функции ((с дивчины, FDEF, mtable) :. не смог найти наследуемый метод для функции «write.parquet» для подписания «data.frame", „символ“»

Кто-нибудь сталкивался с этой проблемой, пожалуйста, помогите мне решить эту проблему.

с уважением

Bala

ответ

0

"data.frame" в сообщении об ошибке означает, что вы используете R data.frame. The write.parquet() Функция используется работает на Спарк DataFrames не R данные рамы ..Подробнее о том, как конвертировать между двумя здесь :. https://spark.apache.org/docs/latest/sparkr.html#creating-dataframes

+0

Спасибо Я пытался сделать то, что предлагается, однако я ударять другую ошибку Теперь 16/06/27 11:25:14 ОШИБКА TaskSetManager :. Задание 0 на стадии 8.0 не удалось 4 раза; прерывание работы 16/06/27 11:25:14 ОШИБКА RBackendHandler: dfToCols на org.apache.spark.sql.api.r.SQLUtils не удался ошибки в invokeJava (isStatic = TRUE, ИмяКласс, имяМетода, ...): org.apache.spark.SparkException: Работа прервана из-за сбоя стадии: Задача 0 на стадии 8.0 не удалось 4 раза, последний провал: Lost задачи 0.3 на стадии 8.0 (TID 440, sghdp0): Java .io.IOException: не удается запустить программу «Rscript» :. ошибки = 2, нет такого файла или директор –

+0

Еще раз спасибо за это SpiritusPrana I отсортировали следующая проблема, которую я заявил. Это потому, что мой Rscript не был в пути. После того, как я получил, что в моем $ PATH write.parquet работает. Большое спасибо за помощь –

+0

Рад, что смог помочь @BalajiKrishnan. Если ответ помог , благодарен, если вы можете согласиться принять ответ. – SpiritusPrana

 Смежные вопросы

  • Нет связанных вопросов^_^