AttributeError: объект 'DataFrame' не имеет атрибута 'get' on sparkle VectorAssembler ML

Я пытаюсь следовать рассмотренному примеру here, и я просто скопировал код в абзац Цеппелина.AttributeError: объект 'DataFrame' не имеет атрибута 'get' on sparkle VectorAssembler ML

%pyspark 
import pandas as pd 
from pyspark.sql import SQLContext 
from pyspark.ml.feature import VectorAssembler 
from pyspark.mllib.linalg import Vectors 

dataset = sqlContext.createDataFrame(
[(0, 18, 1.0, Vectors.dense([0.0, 10.0, 0.5]), 1.0)], 
["id", "hour", "mobile", "userFeatures", "clicked"]) 
print(type(dataset)) 
assembler = VectorAssembler(
inputCols=["hour", "mobile", "userFeatures"], 
outputCol="features") 
output = assembler.transform(dataset)

Однако, я получил эту ошибку:

Traceback (most recent call last): 
    File "/tmp/zeppelin_pyspark.py", line 164, in <module> 
    intp.setStatementsFinished(output.get(), False) 
    File "/home/zeppelin/zeppelin-0.5.5-incubating-bin-all/interpreter/spark/pyspark/pyspark.zip/pyspark/sql/dataframe.py", line 749, in __getattr__ "'%s' object has no attribute '%s'" % (self.__class__.__name__, name)) 
AttributeError: 'DataFrame' object has no attribute 'get'

Любые советы?

источник

2016-05-04 MTT

вы можете попытаться изменить

from pyspark.mllib.linalg import Vectors

from pyspark.ml.linalg import Vectors

источник

2016-08-11 19:39:59 kgnete

AttributeError: объект 'DataFrame' не имеет атрибута 'get' on sparkle VectorAssembler ML

ответ

Смежные вопросы