2016-08-06 2 views
1

Почему существуют существенные различия для оценок Sentiment/Emotion, между методом ввода в виде URL-адреса и прямым текстом с того же URL-адреса?Watson AlchemyLanguage разница в рейтинге для URL-адреса и текста с того же URL-адреса

Например:

  • URL: http://economictimes.indiatimes.com/markets/stocks/news/greed-could-turn-into-fear-anytime-keep-strict-stop-losses-for-long-positions-jimeet-modi/articleshow/53569552.cms.

  • Текст (извлекается из приведенного выше URL):

    Nifty50 открыт с высоким духом в начале недели, погружают в середине недели, но сумел оправиться при поддержке фонтанировать ликвидности в системе. Данные PMI указывают на ускорение в экономике. Макро-индикатор показывает увеличение в 5.2% в июле против 2,8 процента в мае и 2,8 процента в соответствующем предыдущем году. Рынки также постоянно снижают обнадеживающие макроэкономические показатели. Июльские цифры роста автомобилей удивили улицу. Пассажирские автомобили, зарегистрированные в среднем на 12 процентов, сигнализируют о громкой и четкой экономической устойчивости в системе. Путь к новым законам возглавит страну, чтобы стать второй по величине экономикой в ​​мире к концу этого десятилетия. Основные события недели: на прошлой неделе был заложен фундамент для исторической налоговой реформы. Теперь надстройка будет построена в течение определенного периода времени через государственные одобрения и т. Д. GST действительно приведет Индию к ускоренной коррупции, свободной инклюзивному росту для масс в стране. Законодатели добились далеко идущих поправок за скорейшее и быстрое освобождение долгов в течение определенного времени, что еще более усугубило Кодекс о банкротстве для создания свободной экономики в бедных долгах в Индии. Потенциально сейчас экосистема для БПБ будет постоянно изменяться, и они также станут такими прибыльными, как их коллеги из частного сектора. Мы рекомендуем это видео для вас. APSPARC PTY LTDR, рекомендованный Колумбией. Техническая перспектива: Nifty50 обновил восходящий импульс на фоне чрезмерного ралли. Однако митинг не поддерживается индикаторами движения. Но рынки могут оставаться на уровнях перекупленности в течение продолжительных периодов времени во время митингов, связанных с ликвидностью. Жадность ведет к ослаблению рынков. Тем не менее, настроения могут измениться от жадности к страху, в одночасье при появлении некоторых негативных новостей, в результате чего исправления начнутся. Трейдеры должны отслеживать свои остановки на своих длинных позициях, и инвесторы должны оставаться в стороне, пока рынок не коснется более низкого уровня регрессионного канала, который находится на уровне 8300-8400 в Nifty50. Долгосрочный тренд прочен, но краткосрочный срок подходит для коррекции. Ожидания за неделю: рынок загипнотизирован в надежде на то, что макроэкономические факторы будут способствовать дальнейшему экономическому росту и расширению. Рынок будет демонстрировать большую активность в пространстве с средней крышкой, и поэтому индекс линии фронта может не отображать лежащую в основе волатильность в пространстве средней крышки. Компании, работающие в отрасли, в которой работают многие неорганизованные игроки, получат выгоду от GST. Благоприятный муссон и предстоящий праздничный сезон будут держать рынок на ослабленных уровнях. Любая коррекция должна использоваться для создания долгосрочных портфелей. Трейдеры должны играть в акции с импульсом и отслеживать прибыль. Nifty50 закрылся выше на 0,52 процента при 8,683.

+0

Да, я просто забыл добавить пример , Давайте возьмем этот URL и текст из этой статьи. Http://economictimes.indiatimes.com/markets/stocks/news/greed-could-turn-into-fear-anytime-keep-strict-stop-losses-for-long-positions -jimeet-modi/articleshow/53569552.cms – Mahfooz

ответ

1

При использовании URL-адреса AlchemyLanguage пытается извлечь важную информацию с веб-страницы, удаляя навигационные ссылки, рекламные объявления и другие нежелательные материалы. В этом случае я думаю, что извлеченный текст кажется отличным от того, который вы предоставили вручную, используя конечную точку text.

Если вы используете ТЕКСТ, вы в основном отправляете текст, который хотите проанализировать, чтобы у вас не было ненужного текста, подобного URL.


AlchemyLanguage позволяет просматривать извлеченный текст при использовании URL-адреса. Просто добавьте showSourceText=1 к заказу.Это покажет вам текст, который использовался во время анализа.

См: http://www.ibm.com/watson/developercloud/alchemy-language/api/v1/#emotion_analysis

+1

Спасибо @ german-attanasio. Я думал, что Уотсон может извлечь наиболее релевантные входные данные из URL. Мне просто нужно быть осторожным. – Mahfooz

+0

@German: AlchemyLanguage не будет извлекать «ВСЕ» текст из HTML. Он пытается извлечь важную информацию с веб-страницы, удаляя навигационные ссылки, рекламные объявления и другие нежелательные материалы. – RAVI

+0

Затем я уточню свой ответ. –

1

Уотсон пытается извлечь наиболее подходящие входные данные из URL. Но в некоторых случаях он может не получать точные текстовые данные в соответствии с нашим определением основного контента.

В вашем случае согласно вашему определению основного содержания последний пара статей был извлечен дополнительно из URL. (Последний пункт статьи неоднозначно, кто-то может рассматривать его как часть статьи, кто-то не может.)

Последний абзац текста из URL:.

(Автор является генеральным директором, SAMCO ценных бумаг Просмотров и рекомендации, изложенные в данном разделе, являются его собственными, и не отражают позицию ETMarkets.com. Пожалуйста, обратитесь к финансовому консультанту, прежде чем принимать какие-либо позиции.)

Поскольку некоторые лица/Ключевые слова/токены в последнем пункте, который может влияют на общий рейтинг настроений, вы найдете некоторую разницу между двумя баллами.

Вы можете проверить онлайн демо для получения дополнительной информации: Online Demo

Для API вы можете проверить: showSourceText и sourceText Параметры

Ref: Alchemy Sentiment API

+0

Спасибо Рави. Я позабочусь о работе с моими данными. – Mahfooz

 Смежные вопросы

  • Нет связанных вопросов^_^