df:
[Row(split(value,,)=[u'21.0', u'1',u'2']),Row(split(value,,)=[u'22.0', u'3',u'4'])]
как преобразовать каждую строку в DF в LabeledPoint
объект, который состоит из метки и функций, где первое значение является меткой, а остальные 2 являются особенности в каждой строке.преобразования pyspark dataframe меченого точечного объекта
mycode:
df.map(lambda row:LabeledPoint(row[0],row[1: ]))
Это не похоже на работу, новое, чтобы исправить, поэтому любые предложения были бы полезными.
Возможный дубликат [ошибка в помеченном объекте pyspark] (http://stackoverflow.com/questions/38887157/error-in-labelled-point-object-pyspark) –
@LostInOverflow нет, это не так, это из dataframe, и это было из RDD. –
@LostInOverflow может предложить вам что-то для этого? –