2016-12-20 14 views
0

Я пытаюсь определить схему для преобразования пустого списка в dataframe согласно синтаксису ниже:Integertype() в схеме StructType

data=[] 

schema = StructType([ 
StructField("Table_Flag",StringType(),True), 
StructField("TableID",IntegerType(),False), 
StructField("Entry_No",StringType(),True), 
StructField("Dimension_Code",StringType(),True), 
StructField("Dimension_Value_Code",StringType(),True) 
]) 

data=spark.createDataFrame(data,schema) 

но он дает ошибку имени «IntegerType» не определен. Я пробовал с BooleanType, DecimalType, FloatType, IntegralType, но никто не работает. Только StringType и DataType доступны в виде типов данных. В соответствии с документацией types.py IntegerType определен в примерах.

Просьба предложить. Я работаю на свече версии 2.0.1

+0

ли вы импортировали типы? 'from pyspark.sql.types import *' –

+0

Спасибо Daniel .. Я только что импортировал StructType, StructField. –

ответ

2

Добавить импорт в начале файла:

from pyspark.sql.types import IntegerType 

Или еще проще:

from pyspark.sql.types import * 

Чтобы импортировать все классы из pyspark.sql.types