1

Я пытаюсь создать DataFrame, у которого есть столбец, в котором хранятся данные unicode вместо стандартного python string, потому что у моего языка есть дополнительные буквы с акцентом, например. ñ, á, é и другие.Возможно ли создать экземпляр DataFrame с помощью столбца Unicode?

Я пробовал следующее.

x = sqlContext.createDataFrame([u"A", u"B", u"C"], ["letters"]) 

И показано следующее исключение.

TypeError: Can not infer schema for type: <.type 'unicode'>

Затем я прочитал type documentation и не найти совместимый тип данных, поэтому я прошу, если кто-то знает, если это возможно, чтобы достичь этого?

ответ

1

Проблема в том, как вы предоставляете элементы не unicode данных. Даже если у вас есть только один столбец каждый элемент должен быть поддерживаемого типа, как , list или tuple:

df = sqlContext.createDataFrame([(u"A",), (u"B",), (u"C",)], ["letters"]) 
+0

Этот вопрос выглядит бесполезным, но я уверен, многие люди будут иметь эту проблему в будущем –

 Смежные вопросы

  • Нет связанных вопросов^_^