2014-11-17 2 views
1

У меня возникают проблемы, пытаясь извлечь содержимое упакованного gzip следующего URL:Gzip закодированы URL контента

https://www.lendingclub.com/browse/browseNotesAj.action?method=getResultsInitial&startindex=0&pagesize=1

Я могу видеть, что содержимое кодируется с помощью GZIP, глядя на заголовки ответа:

HTTP/1.1 200 OK 
Content-Encoding: gzip 

Я попытался RCurl с помощью getURL, а также это post не повезло. Может кто-то помочь мне попытаться получить содержимое в переменную (надеюсь, без необходимости писать и читать из файла)?

ответ

3

Или в httr

library(httr) 
library(jsonlite) 
out <- GET("https://www.lendingclub.com/browse/browseNotesAj.action?method=getResultsInitial&startindex=0&pagesize=1") 
jsonlite::fromJSON(content(out, "text")) 
$result 
[1] "success" 

$searchresult 
$searchresult$loans 
loanGrade   purpose loanAmtRemaining loanUnfundedAmount noFee primeTotalInvestment     title 
1  C5 debt_consolidation    25     25  0     0 Debt consolidation 
    isInCurrentOrder alreadySelected primeFractions fico wholeLoanTimeRemaining loanType primeUnfundedAmount 
1   FALSE   FALSE    0 720-724     -69999 Personal     0 
    hasCosigner amountToInvest loan_status alreadyInvestedIn loanLength searchrank loanRateDiff loanGUID 
1  FALSE    0 INFUNDING    FALSE   36   1   .00 35783459 
    isWholeLoan loanAmt loanAmountRequested primeMarkedInvestment loanRate loanTimeRemaining 
1   0 7650    7650      0 14.99  1199721001 

$searchresult$totalRecords 
[1] 1472 
2

Оказывается RCurl ручки GZIP кодирования:

getURL('https://www.lendingclub.com/browse/browseNotesAj.action?method=getResultsInitial&startindex=0&pagesize=1', 
     encoding="gzip")