Я пытаюсь реализовать анализ настроений twitter. Мне нужно получить все положительные твиты и отрицательные твиты и сохранить их в определенных текстовых файлах.PIG: Twitter Sentiment Analysis
sample.json
{"id": 252479809098223616, "created_at": "Wed Apr 12 08:23:20 +0000 2016", "text": "google is a good company", "user_id": 450990391}{"id": 252479809098223616, "created_at": "Wed Apr 12 08:23:20 +0000 2016", "text": "facebook is a bad company","user_id": 450990391}
dictionary.text, имеющий все положительные и negetive список блокируемых слов
weaksubj 1 bad adj n negative
strongsubj 1 good adj n positive
Pig Сценарий: -
tweets = load 'new.json' using JsonLoader('id:chararray,text:chararray,user_id:chararray,created_at:chararray');
dictionary = load 'dictionary.text' AS (type:chararray,length:chararray,word:chararray,pos:chararray,stemmed:chararray,polarity:chararray);
words = foreach tweets generate FLATTEN(TOKENIZE(text)) AS word,id,text,user_id,created_at;
sentiment = join words by word left outer, dictionary by word;
senti2 = foreach sentiment generate words::id as id,words::created_at as created_at,words::text as text,words::user_id as user_id,dictionary::polarity as polarity;
res = FILTER senti2 BY polarity MATCHES '.*possitive.*';
описывает Рез: -
res: {id: chararray,created_at: chararray,text: chararray,user_id: chararray,polarity: chararray}
Но когда я свалку Реза я не вижу выход, но он выполняет отлично без каких-либо ошибок.
Какая ошибка, которую я здесь делаю.
Пожалуйста, предложите мне.
Mohan.V
Спасибо за ваш ответ @Sandesh. – Bunny
Я пробовал, что вы предложили. Но все же, его успех работает, но нет выхода. – Bunny
Я редактировал файл словаря, удаляя пробелы. – Bunny