2016-01-05 5 views
0

Я пытаюсь извлечь HTML-код из URL-адреса, используя libcurl. Код ниже работал на каждом сайте, который я пробовал, кроме this one.Получение данных мусора по определенному URL-адресу с помощью libcurl

Выход с этого сайта выглядит следующим образом:

[ksƒT MHDCD.ˏ8weGe) M% Y

Я использую Clang на OS X

C код

#include <stdio.h> 
#include <curl/curl.h> 

int main(void) { 
    CURL *curl; // Curl Handle 
    curl = curl_easy_init(); 
    CURLcode result; 
    curl_global_init(CURL_GLOBAL_DEFAULT); 
    curl_easy_setopt(curl, CURLOPT_URL, 
     "http://mangafox.me/manga/waltz/v01/c001/1.html"); 
    result = curl_easy_perform(curl); 
    curl_easy_cleanup(curl); 
    curl_global_cleanup(); 
    return 0; 
} 

ответ

3

Этот сайт послав ответ сжат с gzip - вы можете сказать, что, глядя на заголовки ответа, они включают в себя:

Content-Encoding: gzip 
+0

Спасибо, что решил мою проблему. Вы должны добавить curl_easy_setopt (curl, CURLOPT_ENCODING, "gzip"); после первого curl_easy_setopt – saasaa

+0

Официальное имя параметра - CURLOPT_ACCEPT_ENCODING, а документация находится здесь: http://curl.haxx.se/libcurl/c/CURLOPT_ACCEPT_ENCODING.html –