Я ищу способ добавления имен столбцов к данным строки фрейма данных. Количество столбцов может отличаться время от времениDataFrame: добавить имя столбца в данные строк
Я Спарк 1.4.1
У меня есть dataframe:
Edit:: все данные String
типа только
+---+----------+
|key| value|
+---+----------+
|foo| bar|
|bar| one, two|
+---+----------+
Я хотел бы получить:
+-------+---------------------+
|key | value|
+-------+---------------------+
|key_foo| value_bar|
|key_bar| value_one, value_two|
+---+-------------------------+
Я попытался
import org.apache.spark.sql._
import org.apache.spark.sql.functions._
val concatColNamesWithElems = udf { seq: Seq[Row] =>
seq.map { case Row(y: String) => (col +"_"+y)}}
какой тип ваш 'value' столбец? – mtoto
также с какой ошибкой вы столкнулись? – Chobeat
@mtoto 'value' имеет значения' String' только – Toren