2016-09-23 8 views
13

Я пытаюсь выяснить размер/форму DataFrame в PySpark. Я не вижу ни одной функции, которая может это сделать.PySpark 2.0 Размер или форма DataFrame

В Python я могу сделать

data.shape() 

Есть ли аналогичная функция в PySpark. Это мое текущее решение, но я ищу для элемента один

row_number = data.count() 
column_number = len(data.dtypes) 

Вычисление числа столбцов не является идеальным ...

+0

Put это в функции? – GwydionFR

ответ

1

Я думаю, что это не похоже функция как data.shape в Спарк. Но я буду использовать len(data.columns) вместо len(data.dtypes)

+1

, который просто дает вам количество столбцов. Как насчет количества строк? – JanLauGe