Регистр значенийAsTable не является членом org.apache.spark.rdd.RDD [Tweet]

Я пытаюсь извлечь данные twitter, используя API-интерфейс отдыха в zeppelin. Пробовал оба варианта registerAsTable и registerTempTable, оба пути не работают. Пожалуйста, помогите мне решить эту ошибку. Получение ниже ошибок при выполнении Цеппелина Tutorial Кода:Регистр значенийAsTable не является членом org.apache.spark.rdd.RDD [Tweet]

error: value registerAsTable is not a member of org.apache.spark.rdd.RDD[Tweet]).foreachRDD(rdd=> rdd.registerAsTable("tweets")

источник

2016-02-10 Sonal

РДД не может быть зарегистрирован в качестве таблицы, тогда как dataframe может. Вы можете преобразовать ваш RDD в dataframe, а затем записать результирующий фрейм как tempTable или table.

Вы можете конвертировать RDD в Dataframe, как показано ниже

val sqlContext = new SQLContext(sc) 
import sqlContext.implicits._ 
rdd.toDF()

См How to convert rdd object to dataframe in spark и http://spark.apache.org/docs/latest/sql-programming-guide.html

источник

2016-02-11 09:04:21 sag

в Zepplin interpretors добавить внешнюю зависимость org.apache.bahir: Spark-потокового-twitter_2.11: 2.0. 0 от GUI и после этого запуска с помощью следующей искровым-2.0.1

import org.apache.spark._ 
import org.apache.spark.streaming._ 
import org.apache.spark.streaming.StreamingContext._ 
import org.apache.spark.{ SparkConf, SparkContext} 
import org.apache.spark.storage.StorageLevel 
import scala.io.Source 
//import org.apache.spark.Logging 
import java.io.File 
import org.apache.log4j.Logger 
import org.apache.log4j.Level 
import sys.process.stringSeqToProcess 

import scala.collection.mutable.HashMap 
/** Configures the Oauth Credentials for accessing Twitter */ 
def configureTwitterCredentials(apiKey: String, apiSecret: String, accessToken: String, accessTokenSecret: String) { 
    val configs = new HashMap[String, String] ++= Seq(
    "apiKey" -> apiKey, "apiSecret" -> apiSecret, "accessToken" -> accessToken, "accessTokenSecret" -> accessTokenSecret) 
    println("Configuring Twitter OAuth") 
    configs.foreach{ case(key, value) => 
    if (value.trim.isEmpty) { 
     throw new Exception("Error setting authentication - value for " + key + " not set") 
    } 
    val fullKey = "twitter4j.oauth." + key.replace("api", "consumer") 
    System.setProperty(fullKey, value.trim) 
    println("\tProperty " + fullKey + " set as [" + value.trim + "]") 
    } 
    println() 
} 


// Configure Twitter credentials , following config values will not work,it is for show off 
val apiKey = "7AVLnhssAqumpgY6JtMa59w6Tr" 
val apiSecret = "kRLstZgz0BYazK6nqfMkPvtJas7LEqF6IlCp9YB1m3pIvvxrRZl" 
val accessToken = "79438845v6038203392-CH8jDX7iUSj9xmQRLpHqLzgvlLHLSdQ" 
val accessTokenSecret = "OXUpYu5YZrlHnjSacnGJMFkgiZgi4KwZsMzTwA0ALui365" 
configureTwitterCredentials(apiKey, apiSecret, accessToken, accessTokenSecret) 

import org.apache.spark.{ SparkConf, SparkContext} 
import org.apache.spark.streaming._ 
import org.apache.spark.streaming.twitter._ 
import org.apache.spark.SparkContext._ 

val ssc = new StreamingContext(sc, Seconds(2)) 

val tweets = TwitterUtils.createStream(ssc, None) 
val twt = tweets.window(Seconds(10)) 

//twt.print 


val sqlContext= new org.apache.spark.sql.SQLContext(sc) 
import sqlContext.implicits._ 

case class Tweet(createdAt:Long, text:String) 

val tweet = twt.map(status=> 
    Tweet(status.getCreatedAt().getTime()/1000, status.getText()) 
) 


tweet.foreachRDD(rdd=>rdd.toDF.registerTempTable("tweets")) 
ssc.start() 
//ssc.stop()

после этого запустить некоторые запросы в табл е в другой zappelin клетки

%sql select createdAt, text from tweets limit 50

источник

2016-11-05 05:28:39 donald

val data = sc.textFile("/FileStore/tables/uy43p2971496606385819/testweet.json");

// конвертировать RDD в DF

val inputs= data.toDF(); 
inputs.createOrReplaceTempView("tweets");

источник

2017-06-04 20:25:50

Спасибо за этот фрагмент кода, который может обеспечить некоторую непосредственную помощь. Правильное объяснение [значительно улучшило бы] (// meta.stackexchange.com/q/114762) его образовательное значение, показав * почему * это хорошее решение проблемы и сделало бы его более полезным для будущих читателей с похожими, но не идентичные вопросы. Пожалуйста, отредактируйте свой ответ, чтобы добавить объяснение, и укажите, какие ограничения и допущения применяются. –

Регистр значенийAsTable не является членом org.apache.spark.rdd.RDD [Tweet]

ответ

Смежные вопросы