Я не могу отображать/показывать/печатать развернутый фрейм с PySpark. Хотя кадр данных, по-видимому, поворачивается, когда я пытаюсь использовать show() на нем, он говорит AttributeError: 'GroupedData
У меня есть много файлов в каталоге, каждый файл содержит текст, охватывающий несколько строк. В настоящее время я использую следующий код, чтобы прочитать все эти файлы в искровой наборе данных (> 2.
Учитывая dataframe: +---+----------+
|key| value|
+---+----------+
|foo| bar|
|bar| one, two|
+---+----------+
Тогда я хотел бы использовать столбец значение в качестве входа в FPGrowth, кото
Я хочу добавить столбец, чтобы искривить фрейм данных, значение которого hashMod существующей строки данных. В приведенном ниже примере я мог бы добиться того же для хэша из 1 конкретной «данных» стол