У меня есть список 2d в Scala под названием dataList
, и я хочу преобразовать его в Pandas DataFrame
.Преобразование списка в Scala в список Python или dataFrame
val dataList: List[List[Int]] = tempData.toList
Если я хочу напечатать dataList
, все работает отлично и тип объекта в Python является
<class 'py4j.java_gateway.JavaObject'>
Насколько я знаю, я должен использовать py4j
, чтобы иметь доступ к коллекциям в Python , Тем не менее, я думаю, что я должен использовать вложенный цикл для доступа к каждому элементу dataList
, а затем положить в DataFrame
. Есть ли более умный способ напрямую преобразовать его в DataFrame
или в список python, а затем DataFrame
?
Я использую Цеппелин 0.5.5
Поскольку я использую Zeppelin, да! – MTT
Затем добавьте 'Apache-Spark' в теги вопроса, этот вопрос может быть полезен для кого-то еще в будущем, или, возможно, у кого-то раньше было это беспокойство. –
Вы правы! Готово. – MTT