Ниже представлена структура таблицы. У меня есть группа записей, представленных в таблице ниже.Как я могу обрабатывать пустые строки, присутствующие в записях, и получать, если их обрабатывать через Spark-Scala?
продукты:
product_id | product_category_id | product_name | product_descrition | PRODUCT_PRICE | product_image
Я хотел, чтобы отсортировать данные, основанные на PRODUCT_PRICE, Поскольку он содержит нулевые данные я получаю ниже исключение . Как я могу достичь этого в Spark-Scala?
val productsRDD = sc.textFile("/user/cloudera/products")
productsRDD.map(rec=>rec.split(",")(4).toFloat,rec).sortByKey().take(5).foreach(println)
Исключение:
java.lang.NumberFormatException: пустая строка
Это не правильно :) – eliasah
@eliasah: Хорошая добыча! , Это сейчас ? ;) –
Это лучше, но это можно сделать лучше. На самом деле это предполагает, что строка пуста, если она не является float, что неверно также – eliasah