apache-spark

0зной

1ответ

RDDData===RET ( 12345, 20170201, Map(12 -> 85, 15 -> 57, 00 -> 3, 09 -> 80, 21 -> 33, 03 -> 7, 18 -> 50, 06 -> 38, 17 -> 43, 23 -> 28, 11 -> 73, 05 -> 16, 14 -> 58, 08 -> 66, 20 -> 35,

1зной

4ответ

Запись на HDFS в Spark/Scala

Я пишу программу spark/scala для чтения в ZIP-файлах, разархивировать их и записать содержимое в набор новых файлов. Я могу заставить это работать для записи в локальную файловую систему, но задавался

1зной

1ответ

Можете ли вы установить фрейм-фильтр Spark в другой Dataframe?

В искры я хочу, чтобы иметь возможность параллелизировать несколько кадров данных. Метод, который я пытаюсь, заключается в том, чтобы вложить данные в родительский фреймворк, но я не уверен в синтакси

0зной

1ответ

Искра с графическими процессорами: как заставить 1 задачу на исполнителя

У меня Spark 2.1.0 работает на кластере с N подчиненных узлов. Каждый узел имеет 16 ядер (8 ядер/процессор и 2 процессора) и 1 графический процессор. Я хочу использовать процесс карты для запуска ядра