2016-03-23 1 views
0

Я ползком конкретный URL из google.com, но я получаю некоторую ошибкуPython 'utf8' кодек не может декодировать байт 0xC3 в положении 72: недействительный продолжение байт

'utf8' codec can't decode byte 0xc3 in position 72: invalid continuation byte 

Код:

import re 
import os 
import MySQLdb 
import codecs 
import requests 
import base64 
import random 
import gzip 
import time 
from multiprocessing.pool import Pool 
import datetime 
import time 

import sys 
reload(sys) 
sys.setdefaultencoding('utf-8') 
def proxy_mesh(): 
    while True: 
     try: 

      data = requests.get('google.com') 

      print data.text.encode('utf-8') 
     except Exception, e: 
      print e 
      print "Trying again" 
      time.sleep(3) 
proxy_mesh() 

Что такое ИСПРАВЛЕНИЕ и как это сделать?

+0

Другими словами, вы пытаетесь расшифровать с помощью 'UTF-8' в то время как кодирование было сделано по-разному , – Leb

+0

hot исправить? @Leb – Mounarajan

+0

Можете ли вы дать трассировку? Это может происходить неявно в нескольких местах. – ShadowRanger

ответ

0

Храните его простым и работает. Данные уже были декодированы модулем requests.

import requests 
data = requests.get('https://www.whoisxmlapi.com/whoisserver/WhoisService?domainName=http://N%E2%94%[email protected]&outputFormat=json') 
print data.text 

Поскольку это ответ JSON, вы также можете обработать его:

import json 
print json.loads(data.text)