Есть ли у кого-либо опыт в очистке данных от Yahoo! Финансовая ключевая страница статистики с R? Я знаком с соскабливанием данных непосредственно из html с использованием read_html
, html_nodes()
и html_text()
от rvest
. Однако эта веб-страница MSFT key stats немного сложна, я не уверен, что все статистические данные хранятся в XHR, JS или Doc. Я предполагаю, что данные хранятся в JSON. Если кто-то знает хороший способ извлечь и проанализировать данные для этой веб-страницы с R, любезно ответьте на мой вопрос, большое спасибо заранее!Веб-скрещивание ключевых характеристик в Yahoo! Финансы с R
Или, если есть более удобный способ извлечь эти показатели через quantmod
или Quandl
, пожалуйста, дайте мне знать, это было бы очень хорошим решением!
В качестве альтернативы, вы можете посмотреть в 'getFinancials()' и 'viewFinancials()' 'методы в quantmod' Он использует данные от Google финансов, хотя и другие параметры ГКЗ не реализованы до сих пор. –
С 'docl = htmlParse ('http://finance.yahoo.com/quote/MSFT/key-statistics?p=MSFT')' вы могли бы видеть раздел '(function (root) { /* - Данные - */'где, по-видимому, есть данные. Например,« бета »: {« raw »: 1.39107,« fmt »:« 1.39 »}', goo luck! – Robert
Спасибо @Robert, я также нашел еще один документ в XHR [Y! Finanace Stats] (https://query2.finance.yahoo.com/v10/finance/quoteSummary/MSFT?formatted=true&crumb=loFaprfreJS&lang=en-US®ion=US&modules=defaultKeyStatistics%2CfinancialData%2CcalendarEvents&corsDomain=finance.yahoo.com), который хранит чистый JSON для показателей! Большое спасибо, поделится скриптом синтаксического анализа позже. – tonykuoyj